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Avant-propos 


« Moi, les mathématiques, je n'y ai jamais rien compris et je 
n'y comprendrai jamais rien ! » Que de fois n'a-t-on entendu cette 
phrase désabusée. Au risque de chagriner nos amis mathémati¬ 
ciens, nous pensons que la plupart des personnes qui la pronon¬ 
cent ont raison. Nous irons même plus loin : nous pensons que 
tous ceux qui font un effort pour apprendre (et non plus pour 
comprendre) les mathématiques ont des chances de perdre leur 
temps. Doivent-ils pour autant fermer ce livre? Peut-être pas. 
Nous allons nous expliquer. 

A la fin de la scolarité secondaire, il existe, dans tous les pays, 
une sorte de « Jugement dernier » — qu'on l'appelle « Baccalau¬ 
réat », « Certificat de fin d'études », ou de quelque autre nom. Il 
isole de la masse des collégiens quelques individus qui ne se sont 
pas noyés dans la mare aux équations et aux problèmes de 
géométrie, c'est-à-dire le petit nombre de gens qui se sentent 
susceptibles de « comprendre les mathématiques ». Et, parmi 
eux, une hiérarchie va s'établir, du banal apprenti mathématicien 
au grand savant international, dont les œuvres ne sont acces¬ 
sibles qu'à quelques-uns, en passant par les élèves des « Grandes 
Écoles », les professeurs, etc. 

Mais ces « mathématiciens » constituent une minorité intellec¬ 
tuelle. La plus grande partie de la population cultivée d'un grand 
pays moderne a développé sa culture en dehors des mathéma¬ 
tiques. Pourquoi? Sans doute parce que les mathématiques ne 
peuvent s'accommoder d'une culture passive (qui n'est souvent 
qu'une illusion de culture), comme les autres sciences, les disci¬ 
plines anthropologiques, littéraires, etc. On peut expliquer au 
« grand public », d'une façon relativement simple, en quoi 
consiste la vaccination, qu'est-ce que l'inflation, le structuralisme, 
la psychanalyse, comment est organisée la matière et comment 
fonctionne un ordinateur. Le lecteur d'un ouvrage de vulgarisa¬ 
tion sur ces questions n'a pas besoin de prendre l'attitude d'un 
médecin, d'un économiste, d'un linguiste, d'un ingénieur pour 
comprendre l'exposé qu'il lit. En revanche, pour tirer profit d'une 
explication du théorème de Pythagore, il faut véritablement 
passer par toutes les étapes de la démonstration et refaire, pour 
son compte personnel, les raisonnements du géomètre, car ce 
sont précisément ces raisonnements qui sont mathématiques; le 
résultat, c'est-à-dire la propriété bien reconnue du triangle rec¬ 
tangle, n'est qu'une sorte de « prime » au raisonnement. Cela 
signifie que, pour comprendre les mathématiques, il faut partici¬ 
per activement à l'élaboration de ce savoir et non pas l'enregistrer 
passivement, comme un enfant écoute une histoire. Or la nature 
humaine est paresseuse. Lire un beau roman ou une belle poésie, 
écouter un concerto de Bach ou un solo de Charlie Parker, 
admirer une toile de Matisse, voir un film de Chaplin sont des 
actions éminemment « culturelles », mais qui ne nous demandent 
pas d'effort apparent; on peut relâcher son attention à l'audition 
du concerto, ne pas « écouter » quelques mesures et se retrouver, 
ensuite de nouveau transporté par les harmonies de J.-S. Bach. 
Cela n'est pas possible quand on lit un ouvrage sur les mathéma¬ 
tiques. Il n'est plus question de sauter une ligne, sinon, on se 
condamne à ne plus rien comprendre. Et c'est pourquoi rien n'est 
plus ingrat que de présenter l'ensemble des connaissances mathé¬ 
matiques, du moins dans leurs grandes lignes, à des profanes ou 
même à des semi-profanes. 

Dans ce livre, nous avons délibérément choisi un parti. Nous 
n'avons pas voulu en faire un recueil de « divertissements 
mathématiques ». Pas davantage n'avons-nous eu l'intention d'en 
faire l'Aide-mémoire du parfait bachelier, c'est-à-dire tout à la fois 
un formulaire, un recueil de définitions et de procédés classiques 
pour résoudre quelques grandes catégories de problèmes (il y a, 
sur ce sujet, d'excellents livres, écrits par des pédagogues avertis 


qui, en utilisant les méthodes de l'enseignement programmé par 
exemple, peuvent mettre à peu près n'importe quel lecteur, à la 
condition qu'il soit homme de bonne volonté, au niveau d'un 
bachelier scientifique). Notre propos a été de passer en revue 
l'ensemble des connaissances mathématiques fondamentales, en 
insistant sur leur genèse historique et logique, sur leur impor¬ 
tance pour l'élaboration de théories plus complexes. Nous avons 
aussi cherché à expliquer comment des domaines entiers des 
mathématiques se sont transformés, depuis environ un siècle, 
grâce aux remises en question des principes de base de l'algèbre, 
de l'analyse et de la géométrie par des mathématiciens, comme 
Cantor, le créateur de la théorie des ensembles, ou comme 
Hilbert, l'un des maîtres de l'axiomatique au début du XX e siècle. 
Certes, nous ne nous faisons pas d'illusions. La théorie des 
ensembles, par exemple, est bien loin de représenter la totalité de 
l'algèbre moderne; elle tient même, à notre avis, une place trop 
importante dans certains programmes scolaires, d'autant que les 
élèves auxquels on l'enseigne savent rarement s'en servir avec 
rigueur et efficacité. Nous lui avons consacré un nombre de pages 
que certains jugeront peut-être excessif : mais il est bon, dans un 
ouvrage comme celui-ci, de familiariser le lecteur avec ce langage 
dont il n'a peut-être jamais rien su, s'il a fait ses études primaires 
et secondaires avant 1960. 

Voici donc comment nous avons procédé. Les matières de 
notre livre sont réparties en quelques grands chapitres, selon 
les divisions traditionnelles des mathématiques (arithmétique, 
algèbre, géométrie, trigonométrie analytique, analyse). Chaque 
chapitre comprend, en général, une introduction historique, com¬ 
plétant l'aperçu historique général formant l'introduction, et li¬ 
sible par tous; nous nous sommes efforcé d'éviter les anecdotes 
et les renseignements biographiques, pour souligner le rôle que 
chaque chercheur a joué relativement aux progrès des théories 
mathématiques. A l'occasion de ces introductions, des notions de 
base sont parfois présentées, et nous ne saurions trop conseiller 
au lecteur novice de les lire attentivement : à ce stade de 
l'exposé, il ne rencontrera aucun obstacle particulier. 

Puis nous reprenons ces notions fondamentales, et nous en 
donnons une description plus générale, tout en conservant le 
contact avec la réalité expérimentale (non pas pour montrer que 
les mathématiques sont une sorte de « science naturelle » très 
élaborée, mais pour souligner les applications possibles de telle 
ou telle théorie, c'est-à-dire pour créer, chez le lecteur hésitant, 
une motivation, en dehors de toute considération de rigueur 
logique). Ensuite, nous récapitulons les définitions, les propriétés, 
le déroulement du raisonnement, en nous plaçant à un niveau 
plus technique : c'est à ce niveau que le lecteur qui « n'a-jamais- 
rien-compris-aux-mathématiques » risque de nous abandonner. 
L'ensemble ne remplace pas, évidemment, un cours complet de 
mathématiques supérieures (ce n'est d'ailleurs pas son ambi¬ 
tion) ; mais il constitue, nous semble-t-il, une introduction géné¬ 
rale à un tel cours, et nous espérons qu'il rendra quelques 
services aux apprentis mathématiciens, en leur proposant une 
synthèse réfléchie, pas trop rébarbative, des connaissances qu'ils 
auront à assimiler au cours de leurs études. Quant aux lecteurs 
non scolaires, ils trouveront sans doute dans cet ouvrage les 
éléments nécessaires pour s'initier, sans trop de perte de temps, 
aux mathématiques d'aujourd'hui. 

Enfin, une Annexe importante fournira au lecteur un résumé 
des connaissances « traditionnelles » sur la géométrie et l'algèbre 
élémentaires, et des compléments détaillés sur certaines théories 
(calcul intégral, fonctions usuelles, géométrie analytique, résolu¬ 
tion des équations différentielles, etc.) qui n'ont pu être dévelop¬ 
pées dans le texte proprement dit. 
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Fragment du papyrus acheté, en 1858, par A. H. Rhind à des paysans qui prétendaient l avoir trouvé dans les ruines voisines du Ramesseum, sur la rive gauche du Nil, à Thèbes. 
Le papyrus de Rhind remonte aux environs de 1600 av. J.-C. et contient l’essentiel du savoir mathématique — d’ailleurs peu développé — des Égyptiens . 


HISTOIRE DES MATHÉMATIQUES 


GÉNÉRALITÉS. 

Point de vue historique et 
point de vue génétique. 

L'histoire des mathématiques. 

Depuis l’Antiquité classique, les mathématiciens et 
les philosophes ont éprouvé le besoin de passer en 
revue, avec plus ou moins de détails, les étapes des 
mathématiques. Le plus ancien historien de la pensée 
mathématique occidentale est sans doute Eudème de 
Rhodes (IV e siècle av. J.-C.), disciple direct d’Aristote, 
et qui avait écrit une Histoire de la géométrie, dont le 
philosophe Geminus de Rhodes (I er siècle av. J.-C.) fit 
une compilation 300 ans plus tard. Cette compilation 
parvint jusqu’au néoplatonicien Proclus (412-485), pro¬ 
fesseur à l’École d’Athènes et auteur de Commentaires 
célèbres sur l’œuvre d’Euclide. Le Prologue des 
Commentaires de Proclus contient une histoire résu¬ 
mée de la géométrie grecque, inspirée de la compila¬ 
tion (perdue) de Geminus faite à partir de l’œuvre, 
perdue elle aussi, d’Eudème de Rhodes. 

Depuis ces illustres ancêtres, l’histoire des mathé¬ 
matiques a eu de glorieux représentants. Les uns 
furent des mathématiciens de profession, qui éprouvè¬ 
rent le besoin de justifier leurs découvertes ou leurs 
théories en se fondant ou en critiquant celles des 
auteurs qui les avaient précédés. Tels furent, par 
exemple : l’Anglais John Wallis dans son Algebra 
(1676) ; le philosophe Leibniz, inventeur du calcul 
différentiel, dans un opuscule écrit en latin : His¬ 
toire et origine du calcul différentiel ( 1714) ; le géomè¬ 
tre Michel Chasles, auteur d’une Histoire de la géomé¬ 
trie (1837). Les autres furent des spécialistes de 
l’histoire des sciences, principalement à partir du 


XVIII e siècle ; parmi ceux-ci on peut citer : le Français 
Montucla ( Histoire des mathématiques, 1758) ; Charles 
Bossut ( Essai sur l’histoire générale des mathémati¬ 
ques, 1802) ; Guglielmo Libri (Histoire des mathémati¬ 
ques en Italie, 1838-1841); Moritz Cantor (ne pas 
confondre avec son homonyme, Georg Cantor, créa¬ 
teur de la théorie des ensembles) dont les Vorlesungen 
über Geschichte Mathematik (Conférences sur l’his¬ 
toire des mathématiques, 1880-1908) sont un ouvrage 
fondamental sur l’histoire des mathématiques jusqu’à 
la fin du XVIII e siècle ; Zeuthen, qui a surtout étudié 
l’Antiquité, le XVI e et le XVII e siècles (entre 1886 
et 1903) ; Paul Tannery, éditeur moderne de Fermât, 
Diophante et Descartes ; Gustav Enestrôm, éditeur de 
la Bibliothequa mathematica (1886-1914), riche en 
précisions, en détails, en renseignements événemen¬ 
tiels ; l’Américain George Sarton ; l’Italien Gino Loria ; 
le Français Abel Rey (sur la mathématique grecque) ; 
Nicolas Bourbaki ; etc. 

Depuis environ un demi-siècle, si on excepte des 
travaux ponctuels (sur une œuvre, un problème, une 
théorie), l’histoire générale des mathématiques n’est 
plus cultivée. En particulier, à part la très riche thèse de 
Cavaillès sur la genèse de la théorie des ensembles, 
l’histoire des mathématiques modernes n’a pas été 
faite : cette lacune dans notre savoir ne semble hélas 
pas près d’être comblée. 

Le point de vue génétique. 

L’historien recense les œuvres des mathématiciens, 
cherche à établir des filiations entre les Écoles, à 
retrouver des textes, à mettre en évidence des influen¬ 
ces, à reconstituer des biographies, etc., c’est-à-dire, 
avant tout, à collectionner les événements dans un 
ordre chronologique. Il peut ensuite tracer le tableau 
d’une époque ou d’une génération. De ce point de vue, 


les erreurs, les fausses thèses, sont aussi intéressantes 
pour lui que les théories vraies, le contenu même de 
ces théories passant au second plan. L’approche géné¬ 
tique des mathématiques est plus intéressante et plus 
ardue. Elle consiste essentiellement à comprendre les 
étapes cruciales qui ont conduit à l’élaboration d’un 
résultat, d’une théorie. Dès lors, l’événementiel n’a plus 
qu’un intérêt secondaire, et c’est l’analyse du proces¬ 
sus de pensée qui devient la préoccupation principale. 
La méthode génétique présente en outre un grand 
intérêt sur le plan de la pédagogie des mathématiques 
(un bon exemple en est donné par le Cours de 
géométrie analytique d’Auguste Comte). 


Les grandes lignes de l'histoire 
des mathématiques. 

Les premières notions mathématiques de l'humanité. 

Nous ignorons à peu près tout des modes de pensée 
propres aux premiers hommes de l’espèce Homo 
sapiens qui ont peuplé la Terre il y a environ 50 à 
100 000 ans. Pour trouver les premières manifestations 
— inconscientes — de la pensée mathématique, nous 
devons nous tourner vers les observations de la psy¬ 
chologie infantile et de l’ethnologie. 

• Deux notions fondamentales. Il est évidem¬ 
ment bien difficile de dire où et quand cette pensée 
embryonnaire a vu le jour. Retenons, d’un monceau 
d’observations, deux processus importants que nous 
retrouverons — épurés, munis d’une armature logique, 
abstraits — en mathématiques. 

— La perception du « plusieurs » : on peut dres¬ 
ser certains oiseaux à choisir leur nourriture dans un 
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LES MATHÉMATIQUES BABYLONIENNES 



Le nombre entier naturel 3 désigne, expérimenta¬ 
lement, la correspondance entre chaque élément 
(feuilles) de l’ensemble I (Trèfle) et chaque élément 
de l’ensemble II (pouce, index, majeur). Toutes les 
fois qu’un ensemble E quelconque pourra être appa¬ 
rié à l’ensemble {pouce, index, majeur / nous dirons 
qu’il contient trois éléments et nous désignerons ce 
fait, soit par un ensemble de bâtons : (III), soit par un 
symbole conventionnel : (3). 


tas de grains plus volumineux qu’un autre ; un enfant 
est capable, au début de la deuxième année de sa vie, 
de réunir en un seul ensemble trois ou quatre objets 
identiques préalablement séparés. Cette aptitude à 
percevoir spontanément la différence entre un ensem¬ 
ble plus nombreux et un ensemble moins nombreux 
est appelé, en psychologie, la perception de la plura¬ 
lité. 

— La notion de correspondance : dès qu’un 
enfant a acquis une certaine habileté manuelle, il est 
capable de grouper des objets deux par deux, selon 
une règle simple déterminée. Par exemple, si on lui 
donne 12 poupées et 12 chaises de poupées, il est 
capable de placer chaque poupée sur une chaise, 
c’est-à-dire d 'apparier les éléments d’un premier 
ensemble aux éléments d’un second ensemble. 
L’enfant est aussi en mesure de constater l’impossibi¬ 
lité de l’appariement : il est embarrassé lorsqu’il y a 
plus de poupées que de chaises ou plus de chaises que 
de poupées. 

• L'arithmétique expérimentale. Parmi les 
ensembles d’objets proposés à sa perception, il en 
reste un que l’homme a toujours à sa disposition: 
l’ensemble de ses 10 doigts (auquel on peut adjoindre 
l’ensemble de ses 10 orteils, dans certains cas du 
moins). Établir la correspondance entre les doigts 
et les éléments d’un autre ensemble, cela consiste à 
compter d’une façon rudimentaire ces éléments. Je 
cueille un trèfle au milieu des herbes, je peux associer 
chaque feuille de ce trèfle à un doigt. 

A ce stade très primitif, « compter » c’est donc 
« apparier » (avec les doigts). Par la suite, l’homme a 
cherché à dénombrer des ensembles plus nombreux 
que celui de ses 10 doigts. Il a sans doute répété cet 
ensemble-étalon autant de fois que c’était nécessaire, 
constituant ainsi, d’une façon purement expérimen¬ 
tale, l'ensemble des nombres entiers naturels, que l’on 
peut écrire avec des bâtons, ou, ce qui est plus 
commode, avec des symboles numériques conformé¬ 
ment à un système de numération : 1, 2, 3, 4, ... 

Sans entrer dans des considérations concernant la 
naissance historique de la pensée mathématique, on 
peut donc affirmer que celle-ci a été, pour une grande 
part, le produit de ces deux aptitudes de l’esprit 
humain. De la sorte, les premiers balbutiements en 
mathématiques de l’humanité ont abouti à Vart de 
compter , puis à l’arithmétique. La géométrie, c’est-à- 
dire la science des correspondances dans l’espace, 
n’est venue que plus tard, lorsque, dans les sociétés 
organisées, se sont développés l’arpentage (lié à la fois 
au droit de propriété et à l’existence des impôts 
fonciers) et l’architecture (liée au développement 
parallèle du pouvoir monarchique et de la religion 
d’État : palais et temples). 

Les ensembles géométriques — lignes, surfaces, 
volumes — étant d’un maniement plus aisé que les 
autres (on peut les représenter facilement par des 
figures) sont devenus, chez les Grecs, l’objet favori 
des mathématiciens. A tel point qu’au XVII e siècle 
encore, le mot « géomètre » était synonyme de 


« mathématicien ». En fait, il ne faut pas perdre de vue 
ce point : les mathématiques ne doivent pas se définir 
par leur contenu (nombres, objets géométriques, gran¬ 
deurs, etc.), mais par leur attitude, ou, comme on dit, 
par leur forme. Qui dit « mathématiques » dit « rigueur 
démonstrative », et nous allons voir que l’histoire de 
cette science est une longue recherche de la cohé¬ 
rence logique. 

Avant les Grecs. 

• La Mésopotamie. Les plus anciens textes 
mathématiques que nous possédions sont des tablet- 
^ tes cunéiformes que nous ont laissées les peuples de 
I l’ancienne Mésopotamie (Sumériens, Akkadiens, Baby- 
| Ioniens, Assyriens). Certaines de ces tablettes ont plus 
, y) de 5 000 ans d’âge ; elles ont été publiées principale- 
£ ment par Thureau-Dangin et O. Neugebauer, un peu 
| avant et un peu après la Seconde Guerre mondiale. Des 
ij commentaires plus récents (1950-1960) en ont été faits 
^ par l’auteur de cette Encyclopédie, puis par E. Bruins. 
^ Voici quels sont les traits les plus remarquables des 
mathématiques assyro-babyloniennes. 

— Les milliers de tablettes qui ont été retrou¬ 
vées peuvent être classées en deux catégories : 

1 - les unes sont des tables numériques (addi¬ 
tion, multiplication, division, élévation à la puissance 2, 
à la puissance 3, racines carrées et racines cubiques), 
analogues aux tables de calculs dont se servent les 
écoliers ; 

2 - les autres contiennent des problèmes, posés 
et résolus, et ressemblent aux recueils d’exercices 
avec corrigés, bien connus des collégiens ; certaines 
tablettes contiennent plusieurs dizaines de problèmes 
du même type, résolus par la même formule (seules les 
données numériques changent d’un problème à un 
autre). 

L’existence de ces tablettes et leur aspect pédagogi¬ 
que montrent la place qu’occupait la mathématique 
chez les anciens Mésopotamiens. 

— Les Mésopotamiens ont été des virtuoses du 
calcul. Ils utilisaient un système de numération, dit 
sexagésimal de position, qui suppose un approfondis¬ 
sement considérable de la notion de nombre. En voici 
les principaux traits. 

1 - Il y a deux signes numériques : 

Y = 1 ; 

< = 10. 

2 - Un nombre inférieur à 60 est écrit à l’aide de 
ces deux signes, convenablement juxtaposés. Ainsi 43 
s’écrit : 

<<<<YYY. 

3 - Nous comptons en dizaines, centaines, mil¬ 
liers, etc. ; les Babyloniens comptaient en soixantai¬ 
nes, soixantaines de soixantaines, soixantaines de 
soixantaines de soixantaines, etc. (leur numération est 
sexagésimale et non pas décimale). Dans notre sys¬ 


tème décimal de numération, le chiffre 1 signifie « un », 

« dix » ou « cent », etc., selon sa position à l’intérieur 
du nombre écrit décimalement. Ainsi 123 signifie : 

(10 2 x1) + (10x2) + 3. 

Il en est de même dans le!s tablettes cunéiformes, où 
le signe Y signifie 1, 60, 60 2 , 60 3 , etc., selon sa position 
(souvent, pour éviter la confusion, le scribe écrit le clou 
plus ou moins grand selon l’ordre d’unités qu’il repré¬ 
sente). Exemples : 

— Y = 1 (mais aussi 60, 60 2 , ... : le contexte fixe 
l’ordre de grandeur) ; 

— YY<signifie (60 x 2) + 10 = 130, mais<YYsigni- 
fie 12, de mêmeYYVsignifie 60 3 + 60 2 + 1 = 219 601 
pour marquer la différence d’ordre d’unités entre les 
trois clous, nous les avons écrits avec des hauteurs 
différentes ; en général, dans les textes cunéiformes, 
cette précaution graphique n’existe pas, et c’est la 
considération des ordres de grandeur des problèmes 
qui permet de dire que YYY= 219 601 et non pas 3. 

4 - Soulignons l’originalité du système en le 
comparant à la notation romaine par exemple : celle-ci 
est une notation par juxtaposition (on additionne les 
lettres : MCCCXXX = 1 000 + 300 + 30 = 1 330) ; les 
opérations avec un tel système sont lourdes et diffici¬ 
les. De plus récriture des grands nombres est une 
tâche ardue. Avec la numération de position, ces 
difficultés disparaissent : on peut calculer à l’aide de 
retenues, on peut écrire n’importe quel nombre grâce à 
l’existence du symbole 0. Toutefois le système assyro- 
babylonien de numération n’était pas aussi parfait que 
le nôtre ; il en diffère en trois points : 1° la base est 
sexagésimale et non décimale, d’où une certaine lour¬ 
deur clans les calculs ; 2° les signes numériques sont 
imparfaits (nous avons un signe pour chaque nombre 
de 1 à 9 ; les Babyloniens ne possédaient pas 59 signes 
distincts) ; 3° le 0 et la virgule n’existent pas chez les 
Babyloniens (mais cet inconvénient est compensé par 
des astuces d’écriture et la considération de l’ordre de 
grandeur des données ; quant au signe 0, il n’apparaî¬ 
tra que tardivement, à l’époque séleucide). 

— Les problèmes proposés conduisent presque 
tous à la résolution d’une équation (du premier ou du 
deuxième degré en général). Aucun texte ne nous 
donne la démonstration des formules employées, mais 
ces formules sont toujours les mêmes et elles sont 
exactes. En particulier les Babyloniens appliquent 
systématiquement la formule : 

- b ± Vb 2 - 4 ac ... 

*=- 27 - (1) 

pour résoudre les équations du second degré de la 
forme : 

ax 2 + bx + c = 0 

(ils désignent l’inconnue parYet mentionnent les coef¬ 
ficients en toutes lettres, en précisant la grandeur 
qu’ils représentent). 

L’existence d’une algèbre aussi remarquable est 


Un exemple de tablette mathématique cunéiforme qui remonte à l’ancien âge babylonien, c’est-à-dire aux 
environs de 1700 av. J.-C. : elle est un peu plus ancienne que le papyrus de Rhind. Le texte qu elle contient est un 
fragment de calcul (sans doute utilisé pour la résolution d’un problème d’algèbre). Le lecteur parviendra 
peut-être à lire les caractères T« au début de la deuxième ligne : le J est l’unité, les signes « signifient 
20 unités du deuxième ordre (20 soixantièmes). De même on peut apercevoir, à la ligne suivante, les signes 
yy^XTTT qui se lisent : a-na 6 et qui signifient « multiplie par 6 ». A la quatrième ligne on donne le résultat de la 

multiplication de par 6, soit 8 ( yjj , au début de la ligne). La suite des calculs indique qu’il faut diviser 8 

par 2 et élever le résultat, soit 4, au carré, ce qui donne 16. 
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LES MATHÉMATIQUES EN ÉGYPTE ET EN INDE 


pour nous un mystère ; elle suppose que les scribes 
mésopotamiens avaient atteint un haut degré d’abs¬ 
traction (on ne trouve pas « par tâtonnements » la 
formule générale de résolution de l’équation du 
second degré). En revanche, il n’y a presque pas de 
problèmes géométriques : les Babyloniens ont été 
essentiellement des algébristes ou, comme les nom¬ 
maient les Grecs des logisticoi (= « calculateurs »). 

— Le savoir mathématique des Mésopotamiens 
est resté en Mésopotamie. Nulle part ailleurs, dans le 
monde de la Méditerranée orientale, on ne retrouve 
une telle perfection et un tel degré d’abstraction. Il 
semble même que les Grecs, qui furent les créateurs de 
ce que nous appelons, en toute rigueur, les mathémati¬ 
ques, ont ignoré les tablettes cunéiformes (les eussent- 
ils connues, qu’ils n’auraient pu les déchiffrer). De 
sorte que la grande tradition algébrique créée par les 
scribes de Sumer et d’Akkad restera lettre morte, 
jusqu’à ce qu’un mathématicien d’Alexandrie, Dio¬ 
phante, la reconstitue (on ignore à partir de quelle 
source) au IV e siècle ap. J.-C. 

• Égypte ancienne. Malgré les affirmations des 
anciens Grecs, les connaissances mathématiques des 
Égyptiens doivent être considérées comme rudimen¬ 
taires, surtout si on les compare à celles des Mésopota¬ 
miens. Elles sont de plus fort tardives : le principal 
texte mathématique égyptien, le Papyrus de Rhind (du 
nom de son découvreur, A. H. Rhind, qui l’acheta à des 
paysans égyptiens en 1858) a été écrit par un scribe 
sous le règne du roi Apophys, c’est-à-dire vers 1600 av. 
J.-C. (il se présente comme la copie d’un écrit plus 
antique, remontant à la XII e dynastie pharaonique). A 
ce texte important s’ajoutent quelques fragments de 
papyrus de la XII e dynastie, quelques écrits plus 
récents, et c’est tout : on est loin des milliers de 
tablettes cunéiformes. 

— Le système de numération égyptien était un 
système décimal par juxtaposition. Il ne semble pas 
que les Égyptiens aient « su compter » au-delà de un 
million. Les signes employés sont indiqués sur la figure 
ci-après. 

i il in n nn 

1 2 3 10 20 

9 £ ) ou ( \ 

100 1000 10 000 100 000 

Comment comptaient les Égyptiens ? Les signes 
numériques sont juxtaposés ; il faut les additionner 
pour connaître le nombre représenté. 


— Le papyrus de Rhind donne des règles de 
calcul relatives aux fractions (addition et soustrac¬ 
tion) ; en fait, les Égyptiens n’ont connu que les 
fractions dont le dénominateur est 2, 3, 4, ..., et les 
fractions 2/3 et 3/4. Leur notation était la suivante (on 
pense qu elle est à l’origine de la barre de fraction 
introduite par les Arabes au Moyen Âge) : 

M = 2 un = i 

Notation fractionnaire chez les Égyptiens. 


— Arithmétique et algèbre : les Égyptiens n’ont 
pas poussé très avant la théorie des nombres ; par 
contre ils savaient résoudre par tâtonnements des 
équations simples du premier degré de la forme : 

ax = b , (2) 

b étant en général un multiple de a. Le papyrus de 
Rhind comprend plusieurs problèmes d’arithmétique 
qui font intervenir, à chaque fois, une recette nouvelle : 
il n’y a ni systématisation du problème, ni perception 
d’une méthode générale de solutions, comme c’était le 
cas dans les textes mathématiques cunéiformes. 

— Quant à la géométrie égyptienne, elle 
concerne à peu près uniquement des mesures de 
surfaces ou de volumes, en relation avec des problè¬ 
mes pratiques d’arpentage. Dans tous les cas il s’agit 
de recettes utilitaires : jamais l’intérêt théorique d’un 
problème ne semble aperçu. 

• Autres apports orientaux antérieurs aux 
Grecs. 

— Les Phéniciens (au I er millénaire av. J.-C.) ont 
repris le système babylonien et ils ont tenté de créer un 
système de numération moins encombrant que le 
système égyptien et qui devait être repris et perfec¬ 



tionné par les Grecs au III e siècle av. J.-C. (système des 
lettres numérales). 

— Les Chinois possédaient un Livre classique 
du calcul , composé entre le VI e et le I er siècle av. J.-C., 
dans lequel est utilisé un système de numération 
comprenant neuf signes différents pour désigner les 
nombres 1,2, 3, 4, 5, 6, 7, 8, 9 et quatre signes distincts 
pour 10, 100, 1 000 et 10 000, plus un signe pour zéro. ^ 
Ce livre comprend aussi un savoir géométrique élé- £ 
mentaire (mesures de surfaces, relations métriques J 
élémentaires, etc.). 

— En Inde, la mathématique, la religion et la ® 
philosophie se confondent. Le savoir géométrique | 
indien est résumé dans la Sutra d’Apastambha (un jj 
sage qui vécut peut-être au V e siècle av. J.-C.). Ce traité 
constitue un « guide pratique de l’architecte » et S 
contient : -g 

1 - des méthodes pour construire des triangles £ 
rectangles à l’aide de cordes ayant pour longueur, 3, 4, 

5 ; 12, 16, 20 ; 15, 20, 25 ; on remarquera qu’il s’agit là| 
de grandeurs pythagoriciennes, c’est-à-dire que le | 
carré de l’une est égal à la somme des carrés des deux £ 
autres : ces méthodes sont donc l’application du théo -1 
rème de Pythagore (qui n’est d’ailleurs ni énoncé, ni 3j 
démontré) ; | 

2 - d’autres constructions ou mesures fondées £ 


sur ce théorème ; 

3 - des méthodes de quadrature (transformer un 
rectangle en carré, un cercle en carré, etc.) ; 

4 - la démonstration géométrique de l’identité 
bien connue : 


On lit nettement, sur ce document astronomique 
égyptien relatif au lever héliaque de l’étoile Sothis 
(calendrier dit d’Éléphantine) les signes numériques 
de la dizaine et de l’unité (en haut : 66, en bas : 80). 


(a + b) 2 = a 2 + 2 ab + b 2 . (3) 


(a+b) 


a b 


a 2 

a b 

a b 

b 2 


La surface du grand carré, de côtés (a + b), est 
(a + b) 2 . On voit sur la figure que cette surface est 
égale à la somme des surfaces a 2 , b 2 , ab et ab, d’où 
l’identité : 

(a + b) 2 = a 2 + 2 ab + b 2 . 


De Thalès à Bourbaki. 


Le théorème de Pythagore a été, pendant des 
siècles, comme le « mot de passe » des géomètres. 
En voici l’exposé dans un document chinois (1), 
dans un manuscrit grec du XII e siècle (2), en arabe 
(3) et dans un traité de géométrie médiévale (4). 
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Le savoir mathématique actuel se compose de théo¬ 
ries, c’est-à-dire d’ensembles de théorèmes décrivant 3 
les propriétés générales de certains êtres mathémati¬ 
ques comme : les nombres entiers, les groupes, les 
équations, les fonctions, les matrices, etc. On trouvera, 
au début de l’exposé de chacune de ces grandes 
théories, un aperçu historique sur leur genèse, leur 
développement et leur achèvement. 

Ici, nous aimerions répondre à la question générale| 
suivante : « Quelles ont été les préoccupations fonda-1 
mentales des mathématiciens au cours des 25 siècles^, 
pendant lesquels se sont constituées les mathé-| 
matiques ? ». Chaque époque a eu en effet ses modes, ^ 
ses problèmes, ses traditions: les anciens Grecs ne£ 
juraient que par la géométrie, les mathémati-® 
ciens du XVIII e siècle s’intéressaient principalement à § 4 
l’analyse et ceux de la fin du XIX e siècle et du début du | 
XX e siècle à la théorie des ensembles par exemple. ^ 
Parallèlement, chaque époque a connu ses déviants, .2 
précurseurs des recherches futures : Archimède | 
annonce Newton et Leibniz à dix-neuf siècles de^- 
distance ; Diophante — le premier grand théoricien de s j 
l’algèbre du IV e siècle ap. J.-C. — fait figure de cher- § j 
cheur isolé dans la lignée traditionnelle des géomètres * 
grecs; plus près de nous, Évariste Galois est, en|: 
1830-1832, le précurseur génial de l’algèbre moderne ; S : 
il n’est pas jusqu’au grand Cantor qui n’ait été âpre-| 
ment critiqué et méconnu en son temps (vers 1875). § 
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LES MATHÉMATIQUES GRECQUES 



seur ; il n’est l’héritier d’aucune tradition hellénique ou 
hellénistique. Son traité (qui comportait 13 livres, dont 
7 ont été perdus) est donc une œuvre pour le moins 
surprenante. Les problèmes posés par Diophante sont 
en effet d’un type nouveau : il ne s’agit plus de trouver 
quelle est la figure dont tous les points respectent une 
certaine condition, ni d’établir une relation métrique 
entre des lignes et des surfaces, mais de calculer une 
grandeur inconnue à partir de certaines relations 
qu’elle entretient avec d’autres grandeurs connues. En 
d’autres termes, Diophante établit la méthode de réso¬ 
lution des équations à une ou plusieurs inconnues, du 
premier ou du second degré ; il donne quelques 
exemples de résolution d’équations particulières d’un 
degré supérieur à 2. Son mérite principal a été d’avoir 
étudié les équations polynomiales (voir ci-après, 
pp. 66-73) à deux variables et d’avoir cherché des 
solutions en nombres entiers. Nous retrouverons l’œu¬ 
vre de Diophante en étudiant l’algèbre, pp. 8-9. 


La mort d’Archimède. (Mosaïque d’Herculanum, conservée à la Liebigshaus de Frankfurt am Main.) 


• Les mathématiques grecques ont été, comme 
on l’a dit, entièrement centrées sur les problèmes 
géométriques. 

— Selon la tradition (Proclus), le fondateur de la 
géométrie grecque aurait été le sage Thalès, au 
VIl e /Vl e siècle av. J.-C. ; Pythagore (personnage 
peut-être mythique) et les pythagoriciens ont déve¬ 
loppé une arithmo-géométrie ouverte à la fois sur la 
théorie des nombres et sur les propriétés des figures 
dans le courant du VI e et du V e siècle av. J.-C. A 
l’époque de Platon (V e /lV e siècle av. J.-C.), les mathé¬ 
matiques connaissent un essor prodigieux, et les 
découvertes se multiplient : Théodore de Cyrène et 
Théétète découvrent les nombres irrationnels V2, 
V3, ... ; Eudoxe de Cnide, astronome et mathémati¬ 
cien, établit la théorie des proportions et de la simili¬ 
tude, aborde les problèmes fondamentaux de la géo¬ 
métrie dans l’espace et celui de la construction des 
courbes dites mécaniques (c’est-à-dire construites à 
l’aide d’autres instruments que la règle et le compas). 

— Au III e siècle av. J.-C. apparaît enfin l’œuvre 
monumentale d’Euclide, qui enseignait les mathémati¬ 
ques à Alexandrie. Dans ses fameux Éléments de 
géométrie, il présente la totalité des découvertes de 
ses prédécesseurs augmentées des siennes propres, 
selon un ordre logique rigoureux, inspiré de la logique 
aristotélicienne (voir p. 75). La géométrie euclidienne 
est une théorie parfaite en soi, si l’on admet les 
propositions de base (axiomes) sur lesquelles elle est 
bâtie ; elle a été enseignée comme telle jusqu’à une 
époque très récente et les esprits philosophiques ont 
admiré de tout temps les « longues chaînes de rai¬ 
sons » (Descartes) qui la constituaient. Le savoir 
euclidien concernait principalement : la ligne droite; 
les polygones, le cercle, la géométrie dans l’espace 
(polyèdre et corps rond); il a été complété au III e / 
II e siècle av. J.-*C. par la théorie des coniques (ellipse, 
parabole, hyperbole), due à Apollonius de Perga. 
Après ce grand savant, la Grèce ne fournit plus que 
des commentateurs, ou des mathématiciens qui ont 
approfondi un point plus ou moins particulier de 
la géométrie classique (Héron d’Alexandrie, Théon 
d’Alexandrie, Pappus, Proclus par exemple). 


— Le grand déviant des mathématiques grec¬ 
ques fut le Syracusain Archimède, qui vécut de 287 à 
212 av. J.-C. (il avait environ 60 ans de moins que le 
grand Euclide). Outre ses contributions à la géométrie 
classique ( Sur la sphère et le cylindre, Sur la mesure du 
cercle, Sur les spirales), il a introduit la considération 
des grandeurs infiniment petites et de la notion de 
limite. Cette attitude, qui annonce le calcul infinitési¬ 
mal du XVIII e siècle, lui a permis d’inventer une 
méthode pour déterminer le nombre tt, qui mesure la 
circonférence d’un cercle de diamètre unité. Enfin 
Archimède s’est intéressé à la théorie des nombres et il 
a proposé, dans L’arénaire, un système de numération 
original fondé sur une remarquable analyse de la 
notion de nombre (voir à ce sujet la page 135 où sont 
décrits le système classique de numération grecque et 
le système proposé par Archimède). 

— Vers la fin du II e siècle av. J.-C., l’astronome 
Hipparque invente une méthode de mesure des distan¬ 
ces angulaires qu’on a appelée depuis la 
trigonométrie (en grec trigônos = « triangle » et 
metron = « mesure »). Hipparque a établi les premières 
tables trigonométriques de l’histoire ; ses calculs et ses 
théorèmes ont été perfectionnés et complétés par 
l’astronome Ptolémée, au II e siècle ap. J.-C. Toutefois, 
les calculs d’Hipparque et de Ptolémée en sont restés 
au simple stade d’une technique au service de l’astro¬ 
nomie ; il faudra attendre les temps modernes pour 
voir la trigonométrie s’ériger en théorie mathématique 
indépendante. 

— Le « mystère » de l’histoire des mathémati¬ 
ques grecques est l’apparition de l’algèbre au IV e siècle 
ap. J.-C. Pourquoi parlons-nous de mystère ? Pour la 
raison suivante : la géométrie grecque n’est parvenue 
au point de perfection qui fut le sien à l’époque 
d’Euclide qu’après trois ou quatre siècles de recher¬ 
ches acharnées et difficiles ; au contraire, l’algèbre, 
telle qu’elle apparaît dans le traité intitulé Les arithmé¬ 
tiques, d’un certain Diophante d’Alexandrie, atteint du 
premier coup à une quasi-perfection. Diophante n’a eu, 
dans les mille ans d’histoire de la mathématique 
grecque qui ont précédé son œuvre, aucun précur¬ 


• L’apport indien n’est pas très important en 
quantité, mais capital par ses conséquences. Les 
Indiens, qui étaient en contact, après les conquêtes de 
Darius et l’expédition d’Alexandre, avec les civilisa¬ 
tions du Proche-Orient, ont sans doute connu le 
système de numération babylonienne par position. Ils 
l’adaptèrent à la numération décimale, créant ainsi le 
système décimal de position qui est notre système 
è actuel. Cette invention capitale a eu lieu vraisemblable- 
| ment entre le II e et le VI e siècle ap. J.-C. ; elle a été 
| ignorée des Grecs. Sans entrer dans les détails, disons 
^ que les signes numériques indiens ont varié au cours 
| des âges (voir figure ci-après). Avec ces signes on peut 
^ écrire n’importe quel nombre, aussi grand soit-il, exac- 
@ tement comme nous le faisons avec nos signes moder- 
^ nés : la valeur d’un signe numérique dépend de son 
^ rang. Ainsi un nombre comme 14 202 signifie (de droite 
jj à gauche) : 

| 2 unités simples -T 0 dizaine 

£ +2 centaines + 4 milliers 4-1 dizaine de mille . 

1 Le signe « 2 » signifie donc « deux unités simples » 
■§> quand il occupe le premier rang à droite, et 
| 2x 100 = 200 quand il occupe le troisième rang en 
3 partant de la droite. L’intérêt majeur du système est 
I qu’il permet de faire mécaniquement les opérations, 
| selon les règles bien connues des retenues. Il suffit de 
connaître pour cela les tables d’addition et de multipli¬ 
cation de la « table des 1 » jusqu’à la « table des 9 ». 

Les autres apports indiens, dus à des mathémati¬ 
ciens comme Aryabhata (V e siècle ap. J.-C.), Brahma- 
gupta (VII e siècle ap. J.-C.), Bhâskara (1114-1185) sont 
d’un intérêt moindre. Les deux premiers ont perfec¬ 
tionné le calcul trigonométrique ; Bhâskara est l’auteur 
d’un traité intitulé Le couronnement du système, dont 


Évolution des signes numériques indiens. 

I — Numération indienne antérieure au système 
de position (remarquez les nombres 1,2 et 3 qui sont 

représentés respectivement par 1, 2 et 3 bâtons). 

II — Numération indienne (X e siècle ap. J.-C.) : on 
constate que certains chiffres (le 2, le 3, le 0) ont déjà 

leur forme définitive. 

III — Numération arabe occidentale au X e siècle : 
les chiffres actuels sont presque entièrement 

constitués. 

IV — Numération arabe orientale au X e siècle. 

V — Numération européenne au XV e siècle : le 5 et 
le 7 n’ont pas encore leur forme définitive. 

- = = U H b ? 

Hindoue (III e s. av. J.C.) ^ 

Hindoue (x e s. ap. J. C.), ^ 

i \ y- jC j 6 i & s ï 

Arabe occidental (x" s.) g 
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LES MATHÉMATIQUES, DU MOYEN ÂGE À L'ÉPOQUE CONTEMPORAINE 


certains chapitres concernent la résolution d’équa¬ 
tions connues des mathématiciens modernes sous le 
nom d équations diophantiennes. 

• Les mathématiques arabes. Il ne faut pas 
exagérer l’importance des mathématiciens arabes. 
Leur rôle s’est surtout limité à conserver e tà transmet¬ 
tre un savoir dont ils n’étaient pas les auteurs, c’est-à- 
dire : les connaissances géométriques et astronomi¬ 
ques des Grecs ; le système de numération des 
Indiens ; les méthodes de Diophante concernant la 
résolution des équations. Comme les Arabes dispo¬ 
saient d’un système de numération commode, décimal 
et positionnel (emprunté aux Indiens), ils perfectionnè¬ 
rent les méthodes de Diophante et donnèrent à l’art du 
calcul un grand essor. L’essentiel de ces travaux de 
compilation eut lieu à Bagdad, capitale des califes 
abbâssides, à partir de 762. Il est remarquable que 
l’œuvre la plus célèbre de la mathématique arabe ait 
été le fait non pas d’un mathématicien créateur, 
comme le furent Eudoxe, Euclide ou Archimède, mais 
un bibliothécaire en chef du calife al-Ma’mun : 
Muhammad ibn Musa al-Hàrizrm (appelé souvent 
al-Khwarizmi par les Occidentaux) (mort vers 850). 

— Le traité d’al-Hârizmï, rédigé au début du 
IX e siècle, enseigne à résoudre des problèmes numéri¬ 
ques, traduits par des équations, à l’aide d’une 
méthode qu’il appelle ai-gabr wa-l-muqâbala, ce qui 
signifie à peu près : « restitution et opposition ». Dans 
ce livre célèbre, connu en Europe dès le XII e siècle, le 
bibliothécaire-mathématicien reprend, pratiquement 
sans les modifier, les méthodes de Diophante. Ce 


traité, qui a donné son nom à l’algèbre ( al-gabr) ne 
marque théoriquement aucun progrès sur les Arithmé¬ 
tiques du mathématicien grec, et ne comporte qu’une 
originalité : l’usage de la numération décimale de 
position, emprunté aux Indiens. Par ailleurs, on ne 
constate aucun progrès ni dans le domaine de la 
symbolique, ni dans le domaine des méthodes (il y a 
bien, çà et là, quelques différences, mais elles sont 
minimes). 

Le traité d’al-Hârizrm fut traduit en latin vers 1120 
par Adélard de Bath, philosophe scolastique qui fit de 
nombreux voyages dans le monde arabe. Ainsi fut 
connu en Occident le système de numération indien 
qu’on appelle, improprement, la numération arabe. Le 
nouveau système eut d’ailleurs bien du mal à s’impo¬ 
ser : les comptables, habitués aux « chiffres romains » 
et aux méthodes de calcul traditionnelles (avec des 
tables), n’étaient pas très enthousiastes. Ce n’est qu’au 
XV e siècle que l’usage de la numération indo-arabe se 
généralisa en Europe. 

Ajoutons un renseignement anecdotique : le mot 
français « chiffre » vient de l’arabe sifr, qui signifie 
« vide » : c’est ainsi que les mathématiciens de Bagdad 
appelaient le signe « 0 ». Pour nommer celui-ci, on se 
servit en France de la transcription italienne de sifr, 
zefiro, qui donna « zéro ». 

• Moyen Âge et Renaissance. 

— Au Moyen Âge, on se préoccupa principale¬ 
ment de reconstituer le savoir mathématique des An¬ 
ciens (principalement : Euclide, Archimède, Apollo¬ 
nius), notamment à partir des traductions latines faites 


sur des versions arabes des œuvres scientifiques grec¬ 
ques. 

— Il faut attendre le XV e et le XVI e siècles, en 
Italie et en France, pour voir renaître un mouvement 
mathématique original. Les mathématiciens italiens de 
la Renaissance (Tartaglia, Cardan, Ferrari, Bombelli 
sont les plus célèbres) ont repris les mathématiques au 
stade où les avaient laissées Diophante et al-jHârizmï, 
c’est-à-dire qu’ils ont principalement développé l’algè¬ 
bre, considérée comme une méthode de résolution 
générale des équations. Ce faisant, ils ont été amenés 
à prendre en considération des êtres mathémati¬ 
ques nouveaux : les nombres négatifs et les nombres 
imaginaires (appelés aussi, selon les auteurs, 
« impossibles », « sophistiques », « faux », etc.). Le 
développement du calcul algébrique a imposé l’usage 
d’abréviations puis de symboles. Le grand art algébri¬ 
que des Italiens s’est propagé, dans la deuxième moitié 
du XVI e siècle, en France et en Flandre. C’est Simon 
Stevin, de Bruges, qui eut l’idée de noter les nombres 
fractionnaires sous la forme décimale ; ce sont des 
Français comme Nicolas Chuquet et surtout François 
Viète qui ont apporté à l’algèbre ses derniers perfec¬ 
tionnements, à savoir le symbolisme littéral (pour 
l’œuvre de Viète, voir ci-après p. 10). 

• Les Temps modernes. 

— Au XVII e siècle, le grand problème fut celui de 
l’application de l’algèbre à la géométrie. Dans ce 
domaine, l’œuvre principale est celle de Descartes, 
inventeur de la géométrie analytique (1637), et celle de 
Desargues, créateur de la géométrie projective (1642- 
1645). C’est aussi à l’aide du calcul algébrique que l’on 
cherche à résoudre le problème général des tangentes 
à une courbe quelconque. Ainsi va naître la géométrie 
infinitésimale, dont Fermât a été le précurseur. 

— La grande découverte de la fin du XVII e siècle 
fut celle du calcul différentiel et intégral, réalisée à peu 
près simultanément par Leibniz en Allemagne et par 
Newton en Angleterre. Cette découverte suffit à ali¬ 
menter tout le XVIII e siècle mathématique européen, 
illustré par les travaux de Bernoulli, Taylor, de Moivre, 
Clairaut, Euler, Cramer, Lagrange. 

Dans le courant du XVIII e siècle, en marge de l’Ana¬ 
lyse, on voit renaître un intérêt pour l’algèbre, non plus 
simplement pour l’algèbre considérée comme l’art de 
résoudre des équations, mais comme une science 
combinatoire : Lagrange introduit le concept d’inva¬ 
riance, et Vandermonde entreprend des recherches 
sur les équations du 5 e degré et sur ce qu’on appelle le 
théorème fondamental de l’algèbre, énoncé (sans 
démonstration) par Girard en 1625 et sur lequel nous 
reviendrons p. 72. 

Notons aussi que le XVIII e siècle ne s’est guère 
préoccupé de la géométrie traditionnelle, sinon pour la 
critiquer (Saccheri fut, en 1733, le précurseur des 
géomètres non-euclidiens du XIX e siècle) ou pour 
l’adapter à des problèmes de construction (invention 
de la géométrie descriptive par Monge en 1800). 

— Le XIX e siècle a été celui de la contestation et 
des révolutions, en mathématiques comme dans les 
autres domaines de l’activité humaine. Il est illustré 
notamment par la création de l’algèbre moderne (théo¬ 
rie des groupes de Galois), par le puissant développe¬ 
ment de l’Analyse (Gauss, Cauchy, Abel, Jacobi, Rie- 
mann, Weierstrass, Poincaré) et par la remise en 
question de la géométrie (géométries non-euclidien¬ 
nes) et de l’analyse, ce qui conduit Cantor et Dedekind 
à élaborer la théorie des ensembles (1872). 

• L’époque contemporaine débute par une cri¬ 
tique de la théorie des ensembles et une crise qui 
s’achève dans les années 30 (théorème de Gôdel sur la 
non-contradiction de l’arithmétique). Depuis cette épo¬ 
que, les efforts des mathématiciens ont été surtout 
dirigés vers l’étude des structures logiques, la théorie 
des nombres et la topologie. Un exposé formel de tout 
le savoir mathématique a été entrepris, en 1939, par un 
groupe de mathématiciens français qui a pris le nom 
collectif de Nicolas Bourbaki. 


PANORAMA CHRONOLOGIQUE. 


Le schéma synoptique proposé à la page suivante 
donne une idée sommaire de l’évolution des différen¬ 
tes branches des mathématiques depuis le XVII e siècle, 
une fois établis, au Moyen Âge et à la Renaissance, les 
résultats fondamentaux de la géométrie, de la théorie 
des nombres et de celle des équations. Pour plus de 
détails, se reporter aux introductions historiques des 
différents chapitres de ce volume. 


Les polyèdres réguliers — qu’on appelait les Cinq corps platoniciens — ont obsédé les savants de l’Antiquité, 
du Moyen Âge et de la Renaissance. C’est ainsi qu’on pensait, au temps de Copernic, que les six planètes 
connues se trouvaient à des distances telles les unes des autres que les Cinq corps devaient pouvoir s’intercaler 
dans les intervalles séparant les sphères orbitales fictives sur lesquelles les planètes étaient censées se 
mouvoir. On appelait cela le Mystère cosmographique (Mysterium cosmographicum). Ci-dessous : une 
illustration de ce « Mystère 5» d’après un dessin de 1597 (le titre en latin signifie : Table montrant les dimensions 
des orbites des planètes et leurs distances par intercalation des cinq corps réguliers ; dans le texte de gauche, 
les polyèdres en question sont appelés << corps d’Euclide » et non « corps platoniciens »). 
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PANORAMA CHRONOLOGIQUE DES MATHÉMATIQUES 


APERÇU SYNOPTIQUE ET ABRÉGÉ DE L’HISTOIRE DES MATHÉMATIQUES. 
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La théorie des ensembles a été élaborée entre 1872 et 1895, à l’époque où la culture européenne subissait d’énormes bouleversements (impressionnisme, expressionnisme, 
symbolisme, le roman russe, la découverte de la radioactivité, etc.). Cette peinture de l’expressionniste norvégien Edvard Munch, Rencontre dans l’espace, est de 1899 : déjà la 
théorie des ensembles était critiquée, et les polémiques mathématiques allaient bon train dans les sociétés savantes d’Europe. 


THÉORIE DES ENSEMBLES, ARITHMÉTIQUE, ALGÈBRE 


GÉNÉRALITÉS. 

Les débuts de la théorie des nombres 
et de l'algèbre. 

La science des nombres chez les Grecs. 

• Problèmes de numération. Les premiers 
mathématiciens de l'histoire ont été confrontés à des 
problèmes qui semblent aujourd’hui bien simples : 
compter des objets (réels ou imaginaires), représenter 
ce compte par un nombre écrit , opérer sur les nombres 
ainsi introduits (additionner, soustraire, multiplier, divi¬ 
ser). Pour résoudre ces problèmes, ils ont tâtonné 
pendant des siècles, chaque génération découvrant de 
nouveaux procédés, de nouvelles méthodes, de nou¬ 
velles astuces. Si le progrès a été lent, c’est sans doute 
parce que chaque civilisation a dû en général refaire 
pour son compte le trajet parcouru par d’autres et 
qu’elle ignorait. Des grands systèmes de numération 
connus des Anciens, celui des Suméro-Akkadiens était 
le plus scientifique (voir p. 2), mais aussi le plus lourd 
à manier; de sorte que même les plus habiles 
mathématiciens de l’Antiquité, à savoir les Grecs, ont 


utilisé d’autres systèmes, tout en se rendant compte 
de leur imperfection (voir p. 135). 

Il n’est sans doute pas inutile de souligner qu’à 
l’époque d’Euclide, c’est-à-dire trois cents ans après la 
naissance des mathématiques grecques, on ne savait 
pas écrire les nombres supérieurs à 10 000 (10 4 ). Le 
nombre 10 000 lui-même était appelé « une myriade » 
et pour exprimer un nombre comme 251 372, on 
écrivait : 

25 myriades plus 1 372. 

Même ainsi, le système était limité au nombre 
100 000 000 (10 8 ), qui vaut une myriade de myriades 
(10 000 fois 10 000). C’est Archimède qui, dans L’aré- 
naire, généralise le procédé de la notation par myria¬ 
des (voir p. 135), et laisse entendre que la suite des 
nombres ainsi notés peut être prolongée indéfiniment. 

• Importance des entiers naturels. Les Pythago¬ 
riciens ont été les premiers à s’intéresser aux proprié¬ 
tés des nombres entiers. Ils les écrivaient en faisant 
usage du système attique (archaïque : voir p. 135), 
très limité, et les représentaient par des points, qui, 
selon leur disposition, permettaient de parler de nom¬ 
bres linéaires, carrés, triangulaires, oblongs, solides. 


Ce faisant, ils n’avaient donc en vue que les seuls 
nombres entiers, appelés aussi entiers naturels ; on 
leur doit principalement d’avoir approché la notion de 
divisibilité et d’avoir découvert qu’il existait des nom¬ 
bres premiers, ainsi qu’une ébauche assez sérieuse 
de la théorie des proportions. 

Cela dit, si on veut savoir comment les Grecs ont 
conçu la théorie des nombres, on peut allègrement 
sauter par-dessus les 250 ans qui séparent Pythagore 
d’Euclide et étudier la manière dont celui-ci l’a présen¬ 
tée. La théorie euclidienne des nombres a dominé 
l’essentiel de la pensée arithmétique et algébrique 
jusqu’au début du XIX e siècle ; elle est exposée dans 
les Livres VII, VIII et IX des Éléments. La théorie des 
proportions — qui ne concerne pas uniquement les 
nombres — est développée au Livre V ; celle des 
incommensurables au Livre X. De l’exposé euclidien, 
on peut retenir quelques points fondamentaux. 

1 - Euclide appelle « nombre » tout nombre 
entier, défini comme « un assemblage composé 
d’unités » (Livre II, définition 2 ; trad. F. Peyrard en 
1819, réédité par J. Itard, Paris, Blanchard, 1966, 
page 180). Il admet implicitement que les opérations 
fondamentales sur les entiers (addition, multiplication) 
sont commutatives (= indépendantes de l’ordre dans 
lequel on prend les termes) et associatives (pour 
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L'ARITHMOLOGIE GRECQUE 



Nombres figurés des Pythagoriciens, d’après un 
manuscrit médiéval du De Arithmetica du Romain 
Boèce (Boetius, v. 480-524). 


additionner trois nombres a + b+ c par exemple, on 
peut indifféremment ajouter c au résultat de la somme 
a+b ou ajouter à a le résultat de la somme b+c; 
même remarque pour la multiplication). 

2-11 utilise la notion de fraction, mais accessoi¬ 
rement : ce que les mathématiciens nommeront 
ultérieurement « nombres fractionnaires » ou 
« rationnels » ne constitue pas pour Euclide un ensem¬ 
ble de nombres. De même les irrationnels sont appelés 
« grandeurs » et non pas « nombres ». Il n’y a évidem¬ 
ment aucune allusion aux nombres négatifs. 

3 - De la tradition pythagoricienne, Euclide a 
conservé le principe de la représentation géométrique. 
Avec toutefois une différence : il représente un nombre 
par un segment de droite et non par un ensemble de 
points. Le nombre 1 (unité) est représenté par un 
segment de longueur arbitraire ; le nombre 2 par un 
segment double, le nombre 3 par un segment triple, 
etc. 

Ainsi donc la science des nombres classique (eucli¬ 
dienne) est l’étude des propriétés des nombres entiers. 
Ces propriétés sont suffisamment nombreuses et suffi¬ 
samment complexes pour occuper des générations de 
mathématiciens : comparaison des nombres, recher¬ 
che de leurs diviseurs, de leurs multiples, étude de leur 
caractère premier ou non, etc. Les trois livres des 
Éléments contiennent en tout 107 propositions parfai¬ 
tement démontrées. Par la suite, les mathématiciens 
enrichiront ce corpus et, vers la fin du XVIII e siècle, le 
nombre de propriétés connues et démontrées concer¬ 
nant les nombres est considérable. Leur ensemble, 
convenablement ordonné, constituera la théorie des 
nombres (au sens restreint, comme on va le voir 
ci-après). 

• L'infini. Il est remarquable que les mathémati¬ 
ciens grecs n’aient raisonné que sur des nombres 
entiers sans jamais se poser la question de leur infinité. 
Certes, ils y songent, mais s’en méfient car ils ne sont 
pas capables de préciser le concept. L’expression 
favorite d’Euclide à ce sujet est « tant de nombres 
qu’on voudra » ; par exemple (Livre VII, pro¬ 
position 35 ; op. cit., p. 206) : 

« Tant de nombres qu ’on voudra étant donné, trou¬ 
vez les plus petits de ceux qui ont la même raison [= le 
même rapport] avec eux. » 

Archimède a eu, lui aussi, l’intuition de l’infini numé¬ 
rique, et il s’en est servi, ne serait-ce qu’en tant que 
précurseur du calcul infinitésimal. Toutefois la science 
et la philosophie grecques se sont toujours senties mal 
à l’aise en face du concept d’infini (les philosophes de 
l’École d’Élée, au V e siècle av. J.-C., avaient construit 
des raisonnements vicieux, fondés sur la division à 
l’infini d’une distance, raisonnement qui débouchait 
sur des conclusions paradoxales). 


• Les nombres irrationnels. Les Pythagoriciens 
étaient persuadés que toute chose pouvait s’exprimer 
par des nombres. Mais ils avaient de ceux-ci une 
notion limitée, puisqu’ils ne connaissaient que les 
nombres entiers ou, à la rigueur, fractionnaires. Or 
l’application du théorème de Pythagore à la mesure de 
la diagonale d’un carré conduit à une impasse. Soit, en 
effet, un carré de côté égal à l’unité de longueur 
(1 pied, 1 mètre, 1 millimètre, peu importe). La diago¬ 
nale de ce carré, c’est-à-dire le segment AC, est 
l’hypoténuse du triangle rectangle ABC. Si nous écri¬ 
vons le théorème de Pythagore appliqué à ce triangle, 
nous obtenons : 

AB 2 + BC 2 = AC 2 , (1) 

c’est-à-dire : 

1+1 =x 2 (2) 

(en appelant x la longueur de la diagonale). Le nombre 
qui mesure cette diagonale a donc pour carré 2. Or, si 
nous consultons une table de carrés, nous voyons 
que : 

12 = 1 x 1 = 1 ; 

2 2 = 2 x 2 = 4 ; (3) 

32 = 3 x 3 = 9 ; 

etc. 

Il n’existe pas de nombre entier dont le carré soit 
égal à 2. On peut alors chercher s’il existe un nombre 
fractionnaire dont le carré soit égal à 2 (c’est-à-dire, 
avec notre système moderne de numération, un nom¬ 
bre décimal) : quels que soient nos efforts, et aussi loin 
qu’on poussera le calcul, nous ne parviendrons jamais 
à un résultat « exact ». Dès le V e siècle av. J.-C., on 
avait démontré, dans les milieux pythagoriciens, que 
s’il existait un nombre x dont le carré fût égal à 2, ce 
nombre devrait être à la fois pair et impair. Comme 
cette double appartenance est impossible, car contra¬ 
dictoire , il en résulte que le nombre x ne peut exister. 

Mais alors, les Pythagoriciens se trouvaient dans une 
position fâcheuse : d’une part ils prétendaient que 
toutes choses — même les astres ! — étaient mesura¬ 
bles, c’est-à-dire appariables à un nombre, et, d’autre 
part, ils démontraient qu’il n’existait aucun nombre 
qu’on puisse faire correspondre à la longueur de la 
diagonale d’un carré lorsque le côté de ce carré est 
égal à l’unité. Plus savamment : les Pythagoriciens se 
trouvaient dans l’obligation d’« avouer » que la diago¬ 
nale était incommensurable avec le côté du carré. 

Cette notion d’incommensurabilité est plus géomé¬ 
trique qu’arithmétique : elle s’est perpétuée jusqu’à 
Euclide, qui appelle irrationnelles des grandeurs (droi¬ 
tes ou aires) qui n’ont pas de commune mesure avec 
une grandeur analogue prise comme unité. 



La diagonale AC est incommensurable avec le côté 
AB du carré. 


De l'arithmétique à l'algèbre. 

• L’œuvre météorique de Diophante, venue 
d’on ne sait où, sans tradition antérieure, tournant 
d’emblée le dos au géométrisme grec classique, mar¬ 
que les débuts de l’algèbre dans notre monde occiden¬ 
tal. Cette « algèbre » — que Diophante nomme encore 
une arithmétique — se présente comme une succes¬ 
sion de problèmes, dans lesquels on doit trouver un 


nombre inconnu x (notation moderne), rattaché à des 
quantités connues par certaines relations. En d’autres 
termes, le nombre x est donné par une équation que 
Diophante nous enseigne à résoudre. 

— Précisons d’abord la nature de l’œuvre de 
Diophante, personnage par ailleurs totalement 
inconnu. D’après le préambule de l’œuvre qui nous est 
parvenue sous le titre Ta Arithmetica {Les arithméti¬ 
ques), elle comportait treize livres dont six sont en 
notre possession. Chaque livre comporte un certain 
nombre de problèmes (trente-neuf pour le Livre I ; 
trente-cinq pour le Livre II ; trente et un pour le 
Livre III ; quarante pour le Livre IV ; trente pour le 
Livre V ; vingt-quatre pour le Livre VI), classés par 
ordre de difficultés croissantes (ou à peu près). La 
résolution de ces problèmes exige à chaque fois la 
résolution d’une équation (du premier ou du second 
degré en général), dont Diophante nous explique 
toutes les étapes. Dans le préambule, l’auteur a pris la 
précaution d’énoncer les règles générales qui permet¬ 
tent de remplacer une équation par une équation 
équivalente. 

Voici un exemple très simple de problème diophan- 
tien (traduction P. Ver Eecke, Paris, Blanchard, 1959, 
p. 9 ; le terme arithme désigne l’inconnue) ; nous 
donnons entre crochets quelques commentaires ou la 
traduction en langage mathématique moderne : 

« Partager un nombre proposé en deux nombres 
dont la différence est donnée. 

Que le nombre donné soit 100, et que la différence 
soit 40 unités, trouver les nombres [résoudre le sys¬ 
tème x + y = 100, y - x = 40]. 

Posons que le plus petit nombre est 1 arithme 
[Diophante écrit en abrégé : « ça » ; ç est la lettre sigma 
qui termine le mot grec arithmos, et a ou a' est le 
nombre 1 dans le système littéral des Grecs ; « ça » 
peut se traduire par «1 x »] ; donc, le plus grand 
nombre sera 1 arithme plus 40 unités [y = x + 40]. En 
conséquence, la somme des deux nombres devient 
2 arithmes + 40 unités [x + y = 2 x + 40]. Or les 
100 unités données sont cette somme ; donc, 
100 unités sont égales à 2 arithmes plus 40 unités 
[2 x + 40 = 100]. Retranchons les semblables des sem¬ 
blables, c’est-à-dire 40 unités de 100 et, de même, 
40 unités de 2 arithmes plus 40 unités [on fait passer 
40 dans le second membre, pour isoler les inconnues]. 


Les Arithmétiques de Diophante (Edition de Tou¬ 
louse, 1670) : c’est une reprise de la première 
édition gréco-latine des Arithmétiques qui datait de 
1621, et qui contient, en outre, les commentaires de 
Fermât sur l’analyse diophantienne. 



DIOPHANTI ALEXANDRINI 

ARITHMETICORVM. 


LIEE 2 ? T^IMTS. 
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ÇVM animaduerterem te 
? ( obfcruandiffimc mihi 
Dionyfi ) ftudio difeendi 
explicationem quaeftio- 
\ num earuin quæ in nu- 
1 meris proponuntur te- 
ncrii aggreflus fum eius rci viam ratio- 
nemque tabricari, ex ipfifque fundamen- 
tis, quibus tota res nititur, initio petico, 
naturam ac vim nuinerorum conftituere. 

Quod negotium vt videatur fortafle dif- 
ficîîius ( quippc ignotum adhuc) cutn 
animimeipientium ad bonamde redex- 
tcè conficienda ipem concipicndam nc- 
quaquam fintprocliues: tamcncùmtua 
alacritas, tum mea dcmonftratio efficiet, 
vt facilè id comprehendas. Cclcriter enim addifeunt 3 quorum ad difeendi cupidi- © 
tatem do&rina accedit. o 


In primum Librum Diophanti Comment arij. ^ 

VÆCVNQVE ante priirtam quxftionetn pvxmifit Diophantus, ea definitio- ^ 
num & principiorum locum obtinent. Scd velutad altiora Feftiaans, hxc luira brëuitate 
pcrftrinxic , vt non cam ea explicare voluiffe videatur, quàrn indicare, tyrondfque q 
admoncre, vt notinifi horum eognitionc iam probè inftruâi ad hofee libros cuol- A 
uendos accédant. Quod fané non obfcuris verbis profeflus eft» definitionc décima ^ 
vndccitnaque, cùm ait eum qui hoc negotij fufeipit in additione , fubduétione , & multlplicatione "3 
fpecierum iam cxcrcitatum efle debere, neenon in xquationibus rite prxparandis apprimè verfatum. § 
Sed & Xilandcr hic mutus eft, & iftaruin dcfinitionurn obfcuritatcm minime diftimulans, vc ’C 
laborcm eas explicandi declinet, le&orem ad fuam Algebram amandat. Scholiaftcs autem Grxcus, -5 
more fuo, multa, fed ea plerunque futilia, vcl h feopo Diophanti prorfus aliéna nobis obtrudic. 

Ego media incedcm via, qux obi curiora videntur breuiter cnodanda fulccpi, nec tamen inutilia, 3 
vcl trita & paftim obuia perfequi ftatui, præfcrtim cùm oninia qux his defimtionibus contincntur, 
in omnibus quotquot à quocunquc authorcextant de logiftica, libris, reperiantur. Cxterum eft 
quod moneam in Grxco fine vlla diftinétione hafee definitiones haberi, quas ego diftingucada< .0 
numeris putaui, vt fie facilius cxplicari, citarique commodius poifint. S 

A 5 
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DIOPHANTE ET AL-HARIZMI 



Le calcul digital: cette image est extraite d’un manuscrit médiéval (X e siècle) du De rerum natura, 
encyclopédie du savoir antique rédigée par le moine northumbrien Bède le Vénérable (673-735). 


Les deux arithmes restants valent 60 unités [2 x = 60], 
et chaque arithme devient 30 unités. 

Revenons à ce que nous avons posé : le plus petit 
nombre sera 30 unités ; tandis que le plus grand sera 
70 unités, et la preuve est évidente [x = 30, y = 70]. » 

— Les caractéristiques de la méthode de Dio¬ 
phante peuvent être résumées comme suit. 

1 - Diophante part de la théorie des nombres 
d’Euclide (« tous les nombres sont formés d’une cer¬ 
taine quantité d’unités... », op. cit., p. 1) et affirme au 
passage que la suite des nombres est infinie (« il est 
classique que leur établissement s’étend à l’infini »). 

2 - Alors que, pour Euclide, le problème était de 
déterminer les propriétés d’un ou de plusieurs nom¬ 
bres (par exemple : deux nombres a et b définis par 
certaines conditions ont-ils un diviseur commun ou 
bien sont-ils premiers entre eux ?), pour Diophante il 
s’agit de calculer un nombre inconnu, qu’il désigne par 

le mot grec arithmos (« arithme » dans la traduction de ^ 
Ver Eecke) ou par l’abréviation s (lettre grecque sigma, § 
finale du mot arithmos). Diophante a d’ailleurs intro- £ 
duit quelques autres symboles pour représenter les six 3 
premières puissances de l’inconnue (x, x 2 , x 3 , x 4 , x 5 , * 
x 6 ) et fait parfois usage d’abréviations opératoires. De | 
ce fait, il est le précurseur d’algébristes comme Viète @ 
qui, au XVI e siècle, créeront le symbolisme algébrique. ^ 
Autres apports intéressants : règles sur les calculs des A 
exposants (x m x n = x m+n ) ; refus des solutions négati- c 
ves qu’il considère comme impossibles. ^ 

— Diophante est à la fois en progrès et en recul -§ 
par rapport à Euclide. En tant que créateur de Valgè- J 
bre, conçue comme l’art de résoudre les équations, il | 
inaugure une des grandes aventures de la pensée * 
mathématique. Mais son attitude logique est très J* 
inférieure à celle d’Euclide, qui reprenait lui-même la | 
théorie d’Eudoxe (définition axiomatique des entiers ? 
comme un ensemble possédant deux lois opératoires 
— l’addition et la multiplication — et dont les éléments 
peuvent être comparés par les relations « égal », « plus 
grand que », « plus petit que »). C’est pourquoi il 
admet que les fractions ou les quantités irrationnelles 
peuvent être traitées comme des nombres, c’est-à- 
dire introduites dans les calculs, sans s’interroger sur 
le fondement de cette assimilation. 

En d’autres termes, Diophante et ses successeurs, 
les algébristes du XVI e siècle, ont calculé sur les 
fractions et les irrationnels comme sur les entiers, et 
ils ont obtenu des résultats exacts. Mais : 1° ils ne se 
sont pas étonnés de ce fait, c’est-à-dire qu’ils n’ont pas 
compris que les entiers, les rationnels et les irration¬ 
nels constituaient un ensemble homogène (l’ensemble 
des réels) ; 2° ils n’ont pas établi les axiomes qui leur 
permettaient cette généralisation ; 3° cette manière 
hâtive et naïve de traiter les « nombres » esquivait les 
difficultés théoriques qui ressurgiront au XIX e siècle et 
imposeront à Cauchy de construire une théorie des 
réels généralisant et consolidant la théorie des entiers 
d’Eudoxe/Euclide. 

• L’apport des Arabes et des Persans, principa¬ 
lement ceux d’al-Hàrizmï (IX e siècle et d’‘Umar 
Hayyëm, a déjà été signalé. C’est d’abord un apport 
formel, hérité des Indiens : le livre fameux d’al-Hàrizmï 
a permis la diffusion de la numération décimale 
de position, de l’usage du trait de fraction entre le 
numérateur et le dénominateur et, concurremment, 
des méthodes de calcul automatiques (valables non 
seulement pour les opérations fondamentales, mais 
aussi pour l’extraction des racines carrées ou cubi¬ 
ques). Les Arabes ont repris et perfectionné les métho¬ 
des algébriques de Diophante relatives aux équations 
du premier et du second degré. Cet apport est donc 
purement technique : il n’y a aucun progrès théorique 
quant à la théorie des nombres et, à cette époque 
encore, l’œuvre d’Eudoxe/Euclide reste inégalée. 

Cependant les germes de tous progrès futurs sont à 
la disposition des intellects proche-orientaux et occi¬ 
dentaux : dès le Haut Moyen Âge, les mathématiciens 
indiens utilisent le zéro d’une manière moderne, c’est- 
à-dire comme un nombre et non comme un symbole de 
numération, et se servent des nombres négatifs pour 
traduire le résultat de certaines opérations commercia¬ 
les (déficit). Arrêtons-nous quelques instants sur ces 
deux points. 

— Pour Eudoxe/Euclide, un nombre est un être 
mathématique qui répond aux définitions énoncées au 
début du Livre VII des Éléments, c’est-à-dire sur lequel 
on peut toujours faire deux opérations : l’ajouter à ou 
le multiplier par un autre nombre pour obtenir un 
troisième nombre appelé somme ou produit des deux 
autres. Ce qui s’écrit, avec la symbolique moderne : 

1 - si a et b sont des nombres, (a + b) est un 
nombre ; 


2 - si a et b sont des nombres, ( ab) est un 
nombre. 

Il en résulte en outre de la définition des entiers 
comme une collection d’unités deux résultats très 
importants : 

1 - entre a et a + 1 il n’existe aucun nombre 
entier ; 

2-1xa = ax1=a: la multiplication d’un 
nombre par 1 ne change pas ce nombre (en langage 
« moderne » on dirait : « 1 est neutre pour la multipli¬ 
cation dans l’ensemble des nombres entiers »). 

Quant aux propriétés générales des deux opérations 
citées (commutativité, associativité, distributivité), pro¬ 
priétés que nous expliquons p. 25, elles sont implicite¬ 
ment reconnues et utilisées dans les calculs. 

— Le symbole 0 (initiale du mot grec ouden qui 
signifie « rien ») n’est pas conçu comme un nombre 
par Eudoxe/Euclide puisqu’il n’est pas une collection 
d’unités. Des expressions comme a + 0 ou « 0 fois a » 
n’ont alors aucun sens : le zéro sert simplement de 
symbole pour indiquer qu’il n’existe aucun nombre ou, 
dans la notation positionnelle des Indiens/Arabes, 
pour indiquer qu’un ordre d’unités est absent 
(105 = une centaine -I- 0 dizaine + 5 unités). Euclide ne 
traite pas le zéro comme un nombre, c’est-à-dire ne lui 
reconnaît pas le droit aux opérations, parce qu’il 
n’entre pas dans sa rigoureuse définition des nombres 
entiers. 

— La soustraction a - b n’est possible que si a 
est plus grand que b ; dans ce cas on peut écrire que 
c = a - b est un nombre (entier). Ni Euclide, ni les 
Arabes n’ont été capables de donner un sens à a - b 
lorsque a est plus petit que b, et c’est là une chose 
curieuse : tout commerçant, quand il calcule son béné¬ 
fice par l’opération prix de vente - prix d’achat, sait 
qu’il gagne de l’argent si le prix de vente est supérieur 
au prix d’achat et qu’il en perd dans le cas contraire. Et 
les commerçants ne manquaient pas ni à Alexandrie, ni 
à Bagdad, ni à Ispahan. Et pourtant cette extension, 
c’est-à-dire la création des nombres négatifs, n’a pas 
eu lieu : elle n’interviendra qu’à la Renaissance, chez 
les algébristes italiens. 

— Autre opération « impossible » dans l’ensem¬ 
ble des nombres entiers : la division de a par b lorsque 
b n’est pas un diviseur (Euclide disait : une partie) de 
a. Nous savons maintenant que le résultat de l’opéra¬ 
tion « a divisé par b », a et b étant entiers, est la 
fraction a/b et que le calcul sur les fractions se fait 
selon les lois du calcul sur les nombres entiers à 
condition que b soit différent de zéro. Les Grecs, et 


Euclide comme les autres, ont utilisé les fractions, mais 
ils ne les considèrent pas comme des nombres ; 
Euclide les appelle des rapports. Dans le langage des 
mathématiciens modernes, nous dirions que les rap¬ 
ports d’entiers sont conçus par les Grecs comme des 
opérateurs, c’est-à-dire comme un processus qui, à 
un nombre N entier fait correspondre un autre 
entier N'. Ainsi le rapport 3/5 appliqué à N, N 
étant un multiple de 5 donne le nombre entier N ' tel 
que N' = 3 x (N/5) ; par exemple, si N = 35, 
l’opérateur 3/5 donne N' = 21. L’opérateur 3/5 appli¬ 
qué à un nombre N qui ne serait pas un multiple de 5 
ne fournit aucun résultat (aucun entier). 

Diophante, les algébristes arabes et les algébristes 
italiens ont considéré les fractions comme des nom¬ 
bres, ce en quoi ils dépassent le point de vue eucli¬ 
dien ; mais ils n’ont pas justifié cette extension d’une 
manière logique. Et la « loi du milieu » des mathémati¬ 
ques est impitoyable : toute théorie, tout système dont 
les fondements ne sont pas rigoureusement cohérents 
entraînent, à court ou à long terme, l’effondrement de 
la théorie, c’est-à-dire l’erreur. 

Les algébristes de la Renaissance. 

L’héritage gréco-arabe a été transmis à l’Occident à 
partir du XII e siècle, par des traducteurs et des 
commentateurs comme Gérard de Crémone ou Léo¬ 
nard de Pise. L’essor de l’algèbre date du XV e et du 
XVI e siècles : l’étude des problèmes et des méthodes 
employées par les mathématiciens de cette époque va 
nous permettre de comprendre l’origine des mathéma¬ 
tiques modernes. 

• Le symbolisme. L’algèbre, pour un mathéma¬ 
ticien du XV e siècle, c’est à peu près uniquement la 
science qui permet de résoudre des équations. Qu’est- 
ce alors qu’une équation ? C’est une phrase (un 
énoncé) par laquelle on exprime qu’une quantité 
inconnue est reliée à des quantités connues. Nous en 
avons rencontré un exemple simple en citant le pre¬ 
mier problème de Diophante (ci-dessus, b). Le calcul 
verbal est très difficile à manier, et celui qui s’y exerce a 
bien du mal à ne pas perdre de vue les résultats à 
atteindre. L’introduction d’abréviations, puis de sym¬ 
boles opératoires a permis de faire des calculs de plus 
en plus compliqués sans trop de difficultés. L’usage de 
lettres pour représenter des nombres quelconques, 
connus ou inconnus, a donné au calcul algébrique une 
plus grande généralité. L’affinement du symbolisme 
algébrique a eu lieu à la Renaissance. Voici quelques 
points de repère. 
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LES ALGÉBRISTES ITALIENS DE LA RENAISSANCE 
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Un extrait du Triparty en la science des nom¬ 
bres (1484) de Nicolas Chuquet ; cette page 
concerne la classification des proportions. 


— Le médecin parisien Nicolas Chuquet est 
l’auteur d’un traité en trois parties appelé Le Triparty 
en la science des nombres (1484), dans lequel il 
étudie les nombres rationnels (entiers ou fractionnai¬ 
res), les nombres irrationnels et la théorie des équa¬ 
tions. Ce traité ne fut publié que tardivement, de sorte 
que l’influence de son auteur sur ses contemporains et 
successeurs immédiats ne peut être retenue. L’apport 
de Nicolas Chuquet, en ce qui concerne le symbolisme 
algébrique, se résume aux points suivants. 

1 - Les nombres sont précédés du signe p ou m 
selon qu’on les ajoute ou qu’on les soustrait ; ces 
signes désignent aussi l’addition ou la soustraction. 
Ainsi 5 — 2 s’écrit: « 5 m 2 ». La multiplication des 
polynômes, par exemple le produit ( a + b) (c - d ), 
exige l’énoncé de la fameuse règle des signes que 
Chuquet exprime ainsi : 

« Oui multiplie plus par moins ou vice versa il en 
vient toujours moins. Qui multiplie plus par plus et 
moins par moins et il en vient plus. Et qui partit plus par 
moins ou moins par plus il en vient moins ». 

2 - Les racines sont notées à l’aide du signe R 7 , 
utilisé déjà par Léonard de Pise : R 2 est la racine 
carrée ; R 3 pour la racine cubique, etc. 

3 - L’inconnue n’est pas écrite, mais son expo¬ 
sant est mentionné ; ainsi 3 2 signifie non pas « 3 2 >>, 
mais 3 x 2 . Cette notation exponentielle permet à Chu¬ 
quet d’énoncer la loi x m x m = x m ' m . 

— L’Allemand Johann Widmann introduit les 
signes « + » et « — » pour marquer le surplus ou le 
manque (1489). 

— Les Italiens ont perfectionné et complété ces 
symboles. Ils nomment l’inconnue cosa ( = « chose » ; 
en latin : res) et récrivent souvent co. en abrégé ; ils 
conservent en général les symboles p et m (qu’ils 
énoncent parfois en toutes lettres : piu pour « plus » et 
meno pour « moins ». La notation exponentielle est en 
recul par rapport à Chuquet : ainsi Pacioli (1494) écrit 
ce. (abréviation de censo) pour « carré », eu. ( cubo) 
pour la puissance 3 ; etc. Le signe « = » n’existe pas 
encore. L’apport très important de Bombelli est étudié 
plus loin. 

— Les Allemands ont repris l’italien cosa et en 
ont fait coss, terme qui désigne aussi l’algèbre. L’algé- 
briste Ch. Rudolff (1525) emploie couramment les 
signes « + » et « - » et introduit le signe V pour la 


racine carrée, le signe vw pour la racine cubique, et 
le signe w pour la racine quatrième ; les puissances 
sont notées comme chez les Italiens, mais à l’aide de 
caractères spéciaux dits cossiques. C’est Stifel qui 
pousse le plus loin la symbolique à cette époque 
(1544). Influencé par Chuquet, dont il connaît l’œuvre 
par des extraits, il insiste sur la théorie des progres¬ 
sions et emploie, pour la première fois, les exposants 
négatifs. Il simplifie la notation du Rudolff pour les 
racines en faisant usage de signes cossiques : 

pour respectivement le carré, le cube et le bicarré. 
Ainsi V^signifie « » dans notre notation (qui a laissé 

tomber l’exposant) ; Vd signifie « \A» et V^signifie 

« V». Enfin Stifel représente les inconnues par les 
lettres A , B , C, ... en les répétant 2, 3, 4, ... fois pour 
indiquer les degrés 2, 3, 4, ... 

AA signifie A 2 ; 

AAA signifie A 3 ; 
etc. 

— Simon Stevin emploie la notation italienne 
(1585) en notant les opérations fondamentales par les 
■fj signes « + » (addition), « - » (soustraction), « M » 

1 (multiplication) et « D » (division). L’originalité de sa 
^ notation réside dans l’introduction des puissances, 
| notées à l’aide d’un cercle, sans mentionner l’incon- 

2 nue. Ainsi : 

S 3 (T) signifie 3x; 

© 3 @ signifie 3 x 2 ; 

g 3 @ signifie 3 x 3 ; 

a etc. 

•c 

£ Cette notation lui permit d’écrire les fractions déci- 
■s males (c’est un de ses titres de gloire). Par exemple, le 
§ nombre 3,141 6 s’écrit : 

| 3 ® 1 © 4 (2) 1 © 6 ©. 

| Quelques années plus tard, on remarquera que les 
S ©> (D» cM signifient 10“\ 10 -2 , etc., ne sont pas 
:§ utiles, et qu’il suffit de séparer les unités entières (ici : 
§ 3) des décimales par un @, ou, plus simplement, par 
une virgule ou un signe de ponctuation quelconque. 

— C’est à François Viète que l’on doit le symbo¬ 
lisme algébrique moderne (1591) : il désigne les incon¬ 
nues par des voyelles (E, /, ...), les quantités connues 
(paramètres) par des consonnes, et crée ainsi Valgèbre 
littérale qui est celle que connaissent — aux notations 
près — tous les collégiens. Une expression comme 
ax 2 + bx + c = 0 est écrite par Viète (en appelant E 
l’inconnue et B, C, D les coefficients) : 

B in E quadr. plus C in E piano + D aequabitur 0 

(in — « que multiplie » ; E quadr. — E 2 ; 

E piano = E 1 = E). 
Bien entendu, Viète utilise aussi le symbolisme des 
Italiens et des Allemands. L’intérêt de l’algèbre littérale 


est évident : elle conduit à énoncer des formules de 
résolution , valables pour toutes les équations particu¬ 
lières. Toutefois c’est à Descartes que l’on est redeva¬ 
ble des derniers perfectionnements de la symbolique 
algébrique. 

• La théorie des nombres. Oublions maintenant 
le problème des notations, qui a gêné sans doute les 
algébristes de la Renaissance mais ne les a pas 
paralysés et examinons comment ils conçoivent les 
nombres et les opérations sur les nombres. 

— La résolution des équations, dès que l’on 
quitte le domaine des problèmes concrets pour abor¬ 
der les cas généraux, impose de considérer d’autres 
nombres que les entiers positifs. Soit en effet a et b 
deux nombres entiers positifs premiers entre eux 
(c’est-à-dire qu’ils n’ont pas de diviseur commun) et 
considérons les équations : 


a + x = 0 ; 

(1) 

ax = b ; 

(2) 

+ 

II 

o 

(3) 


L’équation (1) admet pour solution x=-a (par 
exemple 3 + x=0 est vérifiée pour x=-3, car on a 
alors 3-3 = 0), c’est-à-dire qu’elle possède une racine 
négative. Au XVI e siècle, une telle solution était encore 
appelée « fausse » ou « impossible », ou encore 
« absurde ». Toutefois le calcul impose de traiter les 
nombres négatifs comme les entiers positifs, c’est-à- 
dire de les additionner et de les multiplier, en faisant 
usage de la règle des signes de Nicolas Chuquet. 

L’équation (2) admet comme solution générale b/a 
qu’il faut bien renoncer à considérer comme un opéra¬ 
teur. Une fois définies les règles techniques du calcul 
sur les fractions (réduction au même dénominateur, 
etc.), on passe alors tout naturellement de l’ensemble 
des nombres entiers, cher à Euclide, à celui des 
nombres rationnels (les nombres entiers sont considé¬ 
rés, dans ce cas, comme un cas particulier de nombres 
rationnels, celui de fractions dont le numérateur est un 
multiple entier du dénominateur; ainsi 5 = 15/3 par 
exemple). 

L’équation (3) est plus délicate à résoudre. Il faut en 
effet écrire x 2 = - 1 et chercher la racine carrée du 
nombre négatif - 1. Or, si l’on veut respecter la règle 
des signes, il est impossible de trouver un nombre qui, 
multiplié par lui-même, donne — 1. Deux attitudes sont 
alors possibles : ou bien déclarer que l’équation (3) n’a 
pas de solution, ou bien introduire par convention un 
nombre noté i (ou d’une toute autre manière), défini 
par i 2 = — 1. Avec cette convention, l’équation (3) a 
pour racines +i ou — i, puisque: 

(+ i) x (+ i) = i 2 = - 1 ; (- i) x (- i) = i 2 = - 1 . (4) 

— Historiquement, les choses se sont passées 
d’une manière légèrement différente. Les nombres 
négatifs et les nombres fractionnaires ont été 


Niccolô Fontana, dit Tartaglia (« Le Bègue »), vers 
1499-1557, qui découvrit la méthode générale de 
résolution des équations du troisième degré, en 
1535 (25 ans après qu’elle eut été découverte une 
première fois par Scipione de! Ferro). 



Gerolamo Cardano (1501-1576), qui s’appropria la 
méthode de Tartaglia, utilisée dans l\ Ars magna, en 
1545, pour résoudre les équations du troisième 
degré : la « formule de Cardan » devrait s’appeler, 
en toute équité, la « formule de Tartaglia ». 
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« absorbés » algébriquement à la fin du XV e siècle, et 
« digérés » pendant tout le XVI e siècle. Non sans mal, 
puisqu’il faut attendre 1585 pour voir Simon Stevin 
affirmer que tout ce sur quoi on peut calculer est un 
nombre, et que les qualificatifs « absurdes », 
« irrationnels », « impossibles », « inexplicables » dont 
on décore certains nombres n’ont aucune raison 
d’être. C’est d’ailleurs parce qu’il a admis que les 
nombres négatifs pouvaient être traités comme les 
nombres positifs que Simon Stevin a pu montrer que 
l’équation du second degré avait une solution générale 
(celle qu’on enseigne de nos jours aux collégiens) : 
avant lui, on distinguait trois types d’équations du 
second degré, et on ne comprenait pas la signification 
des racines négatives. 

L’intro duct ion des nombres imaginaires, tels que 
V^ï, V - 2, etc., est due à Bombelli (1550) ; elle a été 
préparée par les recherches de Scipione del Ferro 
(v. 1496-1500), de Tartaglia (1535) et de Cardan (1539). 
Le problème qui s’est posé à ces mathématiciens 
concernait la résolution générale de l’équation du 
3 e degré : 

x 3 + px + q = 0 . (5) 

Sans entrer dans les détails (voir p. 142), disons 
que la solution du problème impose de calculer des 
quantités telles que V^l, qu’on appelait alors des 
« faux nombres » et qu’on nomme maintenant des 
nombres imaginaires. Tartaglia refusait de les prendre 
en considération, et ce refus l’empêcha de découvrir la 
formule générale de résolution ; Cardan les accepta à 
titre d’instrument de calcul, ce qui lui permit de trouver 
la formule connue sous le nom de formule de Cardan, 
mais il ne comprit pas qu’il s’agissait là de véritables 
nombres, sur lesquels on pouvait calculer comme sur 
des nombres entiers. 

Bombelli eut le courage intellectuel de donner droit 
de cité aux nombres imaginaires, et d’éclairer définiti¬ 
vement la théorie des équations du 3 e degré. Le nom¬ 
bre [0 . m . 1], c’est-à-dire en notation modern e (0 - 1), 
ad met, d it-il, deux racines carrées: +V0 —1 et 
- VO -1, qu’il désigne par les symboles respectifs 
p.di.m. et m.di.m. (abréviations de « plus de moins » et 
de « moins de moins »). Dans notre notation moderne 
(due à Euler), on écrirait : 

= i ; - V=1 = - i. (6) 

— Résumons-nous. En s’en tenant aux règles 
opératoires appliquées aux nombres positifs et néga¬ 
tifs, la quantité V^I est « impossible ». Mais si l’on 
pose un nouvel ensemble de règles, le symbole V^T 
peut faire partie de ces grandeurs qu’on appelle des 
« nombres », à condition qu’on cesse de se demander 
ce qu’il signifie concrètement (attitude que ne conser¬ 
veront pas, heureusement, les mathématiciens, puis¬ 
que c’est en s’interrogeant sur leur nature qu’ils ont fait 
progresser la théorie des nombres). Par exemple, si 
nous adoptons la règle complémentaire suivante : 

(VTÏ)2 = - i , (7) 

une opération comme : 

(3 + V^T) x (3 - V^T) (8) 

donne un résultat très « normal » lorsqu’on lui appli¬ 
que la formule bien connue des écoliers 
(a + b){a- b) = a 2 - b 2 . Ici nous avons : 

a = 3, donc a 2 = 9 (règle ordinaire de calcul), (9) 

b = , donc b 2 = - 1 , (10) 

d’après la convention complémentaire (7) ci-dessus. 
Donc : 

a 2 -b 2 = 9-(-1) = 10. (11) 

Le « tour de passe-passe » est terminé : le produ it de 
deux nombres « absurdes » (3 + V^-T) et (3 - V- 1) 
donne un nombre bien réel ! 

Qu’est-ce que cela suppose ? Tout simplement un 
progrès considérable sur les algébristes orientaux : 
pour qu’une notion soit appelée « nombre », il n’est 
plus nécessaire qu’elle représente quelque chose, 
c’est-à-dire qu’elle puisse servir à compter des objets 
concrets ou à mesurer des longueurs géométriques ; il 
suffit qu’on puisse faire sur elles certaines opérations 
fondamentales. Nous verrons que cette attitude naïve 
peut se transformer en une attitude hautement logique, 
en étudiant la théorie des ensembles et l’algèbre 
moderne qui est donc plus, et même autre chose, que 
le simple art de résoudre des équations. 

A la recherche d'une axiomatique. 

Le point des connaissances mathématiques 
au début du XVII e siècle. 

Lorsque Descartes et Fermât commencent leurs 
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recherches mathématiques, sur lesquelles vont se bâtir 
l’algèbre, la géométrie analytique et l’analyse des XVII e 
et XVIII e siècles, la situation des mathématiques peut 
être décrite comme suit. 

• La géométrie, science de la mesure et de la 
position des figures dans l’espace, est toujours la 
géométrie d’Euclide. C’est un monument de perfec¬ 
tion : à partir de trente-cinq propositions fondamenta¬ 
les ( axiomes au sens large), un important corpus de 
théorèmes et de corollaires a pu être établi. La vérité de 
cette géométrie ne fait de doute pour personne, car 
son axiomatique, c’est-à-dire ses règles et définitions 
de base, semble sans reproche. Elle n’a qu’un inconvé¬ 
nient : les problèmes de géométrie sont difficiles à 
résoudre, car il n’existe pas de méthode générale pour 
les traiter. Autrement dit, chaque problème exige qu’on 
invente une méthode de résolution. 

• La théorie des nombres, ou arithmétique, 
comprend la description des propriétés de l’ensemble 
des nombres entiers, de l’ensemble des nombres 
rationnels, positifs et négatifs et de l’ensemble des 
nombres irrationnels (V2 - , V3, etc.). Ces différents 
nombres, dont l’unité a été soulignée par Simon Stevin, 
peuvent être représentés par des segments de droite, 
et les opérations sur ces nombres correspondent à des 
constructions géométriques. Dans la mesure où la 
géométrie est certaine, elle confère donc cette certi¬ 
tude à la théorie des nombres. Et c’est pourquoi 
Bombelli, puis Descartes ont insisté sur la signification 
géométrique des opérations sur les nombres (voir 
figure ci-contre). Une fois cette correspondance 
assurée, le mathématicien peut calculer à loisir et faire 
confiance à la combinatoire numérique : elle ne le 
trahira jamais, puisqu’elle est le reflet abstrait de la 
géométrie. 

• L’algèbre, ou théorie des équations, est donc, 
elle aussi, une science certaine, aussi solide que la 
géométrie. Descartes, en perfectionnant le symbolisme 
de Viète, lui a donné son aspect moderne : les incon¬ 
nues sont désignées par x, y, z ... ; les quantités 
connues par a, b, c ... ; les opérations par les symboles 
« + » s « — », « x » et par la barre de fraction ; la 
notation exponentielle est acquise, et aussi celle des 
radicaux. Depuis les travaux des algébristes italiens, 
venus compléter ceux de Diophante et des Arabes du 
Moyen Âge, on sait résoudre, à l’aide de formules 
comportant ou non des radicaux, c’est-à-dire des 
extractions de racines, les équations générales du 
premier, du deuxième, du troisième et du quatrième 
degré (l’équation du quatrième degré a été résolue par 
Ludovico Ferrari, élève de Cardan, vers 1545). 

Une seule ombre au tableau : les nombres négatifs et 
les nombres imaginaires. On les admet pour le besoin 
des calculs et pour la résolution des équations, mais 
personne n’a su encore déterminer leur équivalent 
géométrique, qui leur donnerait la même garantie 
axiomatique qu’aux nombres positifs (entiers, fraction¬ 
naires ou irrationnels). 

L'algèbre et l'analyse au XVII e et au XVIII e siècle. 

• Au XVII e siècle l’algèbre pure semble se repo¬ 
ser sur ses lauriers. Une bonne armature symbolique 
permet le développement — avec toutes les subtilités 
que cela comporte — du calcul algébrique et la 
résolution des équations devient — presque — un jeu 
d’enfant. Ce qui est nouveau, et ce qui va passionner 
pendant deux siècles les mathématiciens, c’est un 
domaine de recherches qui repose sur deux découver¬ 
tes fondamentales. 

— Descartes invente, à partir de 1619, la géomé¬ 
trie analytique (qu’il exposera en 1637). Il s’agit d’une 
méthode permettant de traduire algébriquement, par 
des équations, les propositions géométriques. Cette 
découverte capitale, à laquelle a aussi participé le 
Français Fermât, n’est pas seulement un progrès 
méthodologique, c’est un pas en avant vers l’unifica¬ 
tion des mathématiques. 

— Environ un demi-siècle après les travaux de 
Descartes, et après ceux de plusieurs précurseurs 
comme Cavalieri, Barrow, Fermât, Pascal, etc., le cal¬ 
cul infinitésimal est inventé presque simultanément 
par Newton et Leibniz (voir ci-après, p. 102 l’histoire 
de l’analyse). Les premiers éléments de ce calcul 
avaient été posés quelque deux mille ans auparavant 
par Eudoxe et Archimède (méthode dite d’exhaustion). 
Le calcul infinitésimal, qui fut le premier objet de 
l 'analyse, se présente comme un élargissement du 
champ de l’algèbre traditionnelle et, en conséquence, 
de la géométrie analytique : il porte sur des grandeurs 
infiniment petites et non plus sur des nombres réels ou 
imaginaires, et il est l’auxiliaire indispensable de 


a b u - 1 

A B C D 

I — Les segments a = 4 et b = 2,5 (unité u = 1). 

A a C b D A D C 

Uc-1--J -1 

-£- d a b B 

c - a + b 

Il — Somme et différence des nombres a et b. 




E A -— - 

IV — Racine carrée du nombre a : \Jâ = AH. 


Équivalents géométriques des opérations sur les 
nombres positifs (entiers, fractionnaires ou irration¬ 
nels). Soit a et b (a> b) deux nombres positifs, 
représentés par deux segments AB et CD de lon¬ 
gueur a unités et b unités. 

I — La somme a + b est le segment de longueur c 
obtenu en portant bout à bout les segments AB et CD 
(B et C confondus). 


Il — La différence a- b est le segment AD = d, 
obtenu en portant CD sur AB comme on l’a indiqué 
sur la figure. 


III — Le produit ab est obtenu comme suit. On 
porte AB = a sur l’axe Ox où l’on marque aussi le 
segment unité AE = 1 . Sur une droite quelconque Oy 
on porte CD = b et l’on joint DE ; on mène par B la 
droite parallèle à DE, soit BF. Le théorème bien connu 
de Thaïès permet d’écrire : 


AB _ AE 
CF ~ CD 


soit : 


a 1_ 
CF b ’ 


d’où, en faisant le produit des extrêmes et le produit 
des moyens : ab = CF : le segment CF représente 
donc le produit ab. De même b représente le quotient 
de CF par a, et a le quotient de CF par b. 

IV — La racine carrée de a s’obtient en menant 
AE = 1 dans le prolongement de AB du côté de A et en 
traçant le demi-cercle de diamètre EB. Les théorè¬ 
mes de géométrie sur le triangle rectangle permet¬ 
tent d’écrire la relation : 

AH 2 = AE x AB , 


soit : 

AH 2 = 1 x a = a. 

d’où \fa = AH : le segment AH représente donc la 
racine carrée du nombre a. 


l’étude des fonctions d’une variable réelle. 

• Au XVIII e siècle, l’analyse l’emporte sur l’algè¬ 
bre, dans la mesure où elle est considérée comme la 
théorie des équations. Cependant un certain nombre 
de problèmes algébriques restent en suspens. 

— La résolution de certaines équations diffé¬ 
rentielles (les équations différentielles linéaires du 
deuxième ordre à coefficients constants : voir à ce 
sujet p. 158), qui est un important chapitre du calcul 
différentiel et intégral, impose de résoudre une équa¬ 
tion du second degré classique appelée équation 
caractéristique dont les coefficients sont précisément 
les coefficients de l’équation différentielle proposée et 
de considérer ses racines imaginaires aussi bien que 
ses racines réelles (voir ci-après pp. 71-72, où 
est expliquée la résolution de l’équation du second 
degré) : les nombres imaginaires, pour lesquels Euler 
définit le symbole i par i 2 = - 1, semblent donc avoir 
une importance plus grande que celle que leur accor¬ 
daient les algébristes italiens et leurs successeurs 
immédiats. Le fait que ces nombres puissent servir au 
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calcul trigonométrique (de Moivre, 1730) ne peut que 
confirmer cette impression : il faudra toutefois atten¬ 
dre le XIX e siècle pour que les nombres imaginaires, 
qu’on baptisera complexes, fassent l’objet d’un traite¬ 
ment logique. 

— La théorie des équations stagne. Malgré tous 
leurs efforts, les mathématiciens ne parviennent pas à 
découvrir la formule générale permettant de résoudre 
des équations d’un degré supérieur à 4 à l’aide de 
radicaux. Pour faire comprendre ce problème, consi¬ 
dérons l’équation générale du second degré : 

ax 2 + bx + c = 0 . (1) 

Résoudre cette équation, c’est trouver la valeur de x 
qui la vérifie, a, b et c (les coefficients) représentant 
des nombres connus. On démontre à tous les collé¬ 
giens que cette équation possède deux racines (deux 
solutions), x' et x" : 

, b V b 2 - 4 ac 

X “ ~2a + 2a ’ 

_ b V b 2 - 4 ac (2) 

" 2a 2a ’ 

Pour discuter cette équation, on étudie le signe de la 
quantité A = b 2 - 4 ac qu’on appelle le discriminant de 
l’équation. Si A est positif, VA est un nombre réel et 
les deux racines x' et x" sont réelles et distinctes. Si A 
est nul, les deux racines se confondent en une seule et 
l’on a x' = x" = — b/2 a : c’est ce qu’on nomme une 
racine double (ou encore une racine d’ordre 2). Si A 
est négatif, \TÂ est imaginaire et les racines x', x " sont 
elles-mêmes complexes. Ainsi donc, dans tous les cas, 
l’équation du second degré admet deux racines, qui 
peuvent être réelles (distinctes ou confondues) ou 
complexes. 

Cardan a montré, par une méthode qui lui est propre, 
que l’équation du 3 e degré 

ax 3 + bx 2 4- ex + d = 0 (3) 

possédait trois racines, réelles ou complexes, distinc¬ 
tes ou confondues ; et Ferrari a montré que l’équation 
du 4 e degré 

ax 4 + bx 3 + ex 2 + dx + e = 0 (4) 

avait toujours quatre racines, réelles ou complexes, 
distinctes ou confondues. Il est donc assez « naturel >> 
(?) de penser que le nombre de racines d’une équation 
générale de degré n était égal à n, à condition 
d’accepter les racines complexes et de tenir compte 
des racines confondues. C’est ce que fit A. Girard 
( Invention nouvelle en algèbre, 1629) qui énonça, sans 
la démontrer, la proposition connue sous le titre de 
théorème fondamental de l’algèbre : une équation de 
degré n a exactement n racines, en comptant les 
racines « impossibles » (imaginaires), chacune avec 
son degré de multiplicité (une racine double compte 
pour deux, une racine triple compte pour trois, etc.). 
Nous retrouverons bientôt ce théorème capital que 
tentèrent en vain de démontrer, dans la période qui 
nous intéresse ici, Descartes (1637), Newton (1685), 
Euler (1742) et D’Alembert (1746). Ce dernier fit faire 
des progrès à la question en démontrant notamment 
une proposition préliminaire indispensable à la 
démonstration du théorème fondamental de l’algèbre, 
et qu’on appelle le lemme de D’Alembert. 

— Un autre domaine qui intrigua fort les algé- 
bristes du XVIII e siècle fut celui de l’ algèbre linéaire, 
c’est-à-dire de la théorie des équations du premier 
degré. 

Rien n’est plus simple qu’une équation du premier 
degré à une inconnue, de la forme ax + b = 0. Elle 
admet, comme chacun le sait, une solution x = - b/a, 
à la condition que a soit différent de 0. D’autre part 
tous les collégiens ont appris à résoudre un système de 
deux équations du premier degré à deux inconnues x 
et y, système qui se présente sous la forme générale : 

fax + by = c ; 

[a ' x + b ' y = c '. 

Page 58, nous expliquons que les racines x et y de 
ce système sont données par : 

cb' — bc’ 

y = - ■ 


ab' - ba f ' 

La quantité ab'—ba', qui sert à résoudre le 
système (5) est appelée le déterminant du système. 
Lorsqu’on veut résoudre un système de trois équations 
linéaires à trois inconnues, de quatre équations linéai¬ 
res à quatre inconnues, ..., de n équations linéaires à n 


inconnues, on procède d’une manière analogue, en 
calculant une grandeur qui est fonction des coeffi¬ 
cients du système et qui est le déterminant de ce 
système. La méthode, entrevue par Leibniz, a été 
systématisée par Cramer (1750) et perfectionnée dans 
la seconde moitié du XVIII e siècle par Bezout (1764), 
Vandermonde (1772), Laplace (1772), Lagrange (1773) 
et bien d’autres. 

L’étude des systèmes du premier degré à n incon¬ 
nues, qui constitue l’algèbre linéaire, n’en est pas 
restée là. En effet, il peut se trouver que le nombre des 
équations ne coïncide pas avec le nombre d’incon¬ 
nues. Dans ce cas, la théorie des déterminants est en 
défaut, et il faut introduire d’autres méthodes, qui ne 
seront découvertes qu’au XIX e siècle et qui ouvriront 
elles aussi une voie royale à l’algèbre linéaire. 

Naissance de l'algèbre moderne. 

• Les difficultés de l’analyse, à la fin du XVIII e 
siècle, ont remis à la mode le problème de la résolu¬ 
tion des équations algébriques. Elles concernent un 
chapitre de l’analyse intitulé « Intégration des fractions 
rationnelles », que nos lecteurs peuvent très bien 
ignorer pour l’instant. Il suffit de savoir que ce pro¬ 
blème conduit à chercher les zéros d’un polynôme 
P(x) (lire : « P de x »), c’est-à-dire les valeurs de x 
pour lesquelles on a : 

P(x) = 0 . (7) 

Un polynôme de degré n est de la forme : 

P(x) = a 0 x n + a 1 x"- 1 + a 2 x n ~ 2 + — + a n _, x + a„. (8) 
Pour n — 1, 2, 3 ou 4, la question a été résolue depuis 
le XVI e siècle, et l’on savait résoudre l’équation (7) à 
l’aide de radicaux. Vandermonde et Lagrange cherchè¬ 
rent à résoudre des équations de degré supérieur à 4 
vers 1770-1774, et cela les conduisit à approfondir la 
théorie des polynômes et les méthodes algébriques 
dites de combinaison et de substitution. 

Les idées de Vandermonde et de Lagrange furent 
reprises au début du XIX e siècle par trois mathémati¬ 
ciens de génie : Gauss (qui démontra le théorème 
fondamental de l’algèbre en 1799-1801), Abel et Galois. 
De leurs travaux et de ceux de Cauchy devait sortir la 
théorie des groupes de substitution, l’un des chapitres 
fondamentaux de l’algèbre moderne qui devait aboutir, 
cent ans plus tard, aux travaux d’Emmy Noether (1921- 
1927) sur I ’algèbre commutative, l’une des principales 
branches des mathématiques modernes. 

Toutefois les théories de Gauss et de Galois n’ont 
pas été vraiment comprises en leur temps ; de sorte 
que l’algèbre moderne est née d’autres préoccupa¬ 
tions. Lorsqu’elle a été constituée, on a constaté 
qu’elle était contenue en puissance dans les travaux 
abondants de Gauss et dans les notes brèves mais 
géniales écrites par Galois dans la nuit qui précéda sa 
mort (en duel, à l’âge de 21 ans). 

• La généralisation de la notion de nombre 
repose sur les travaux de Gauss, au début du XIX e 
siècle, relatifs aux nombres complexes (dès 1797, 
Gauss avait étudié le problème de la représentation 
géométrique des nombres complexes, mais il n’a livré 
ses résultats au public savant qu’à partir de 1831. Un 
nombre complexe est un être mathématique défini par 
la relation : 

z = a + bi, (g) 

définition des réels, voir p. 52) c’est-à-dire des nom¬ 
bres entiers ou fractionnaires, rationnels ou irration¬ 
nels, positifs, négatifs ou nuis, et i un symbole défini 
P ar ,2 7 ~ 1 ■ Si b = 0, on a z = a, et le nombre z se 
réduit à un nombre réel. L’addition de deux nombres 


Représentation géométrique d’un nombre 
complexe z = a+ bi. 




Georg Cantor (1845-1918), créateur de la théorie 
des ensembles ; son œuvre la plus célèbre a été 
publiée en 1895-1897 : Contributions au fondement 
de la théorie des nombres transfinis. 


complexes z = a + b i et z' = a' + b' i se fait selon les 
règles générales du calcul classique ; on obtient un 
nouveau nombre complexe : 

z + z' = (a + a!) -F (b + b') i =A + B\ . (10) 

De même le produit zz' de deux nombres complexes 
est le nombre complexe : 

zz'= (aa'- bb f ) + {ab'+ ba') i. (il) 

L’image géométrique d’un nombre complexe 
z = a + bi est un point A, de coordonnées rectangulai¬ 
res (a, b). 

Cette représentation géométrique a été proposée, 
avant la publication de Gauss, par le Danois Wessel (en 
1798) et par le Suisse J.-R. Argand (en 1806). Cauchy a 
employé une méthode analogue de représentation. Ces 
théories attirèrent l’attention des mathématiciens sur 
de nouveaux êtres mathématiques, susceptibles d’être 
les objets d’une nouvelle algèbre : vecteurs, quater- 
nions et nombres hypercomplexes, matrices, qui furent 
notamment étudiés par l’école britannique (Hamilton, 
Clifford, Sylvester, Cayley) et par les mathématiciens 
allemands Môbius et Grassmann. Ainsi se constitue, à 
partir de 1840/1850, ce qu’on appelle I ’algèbre linéaire 
(voir p. 58). 

En 1854, Riemann élargit encore ce point de vue en 
montrant qu’on peut calculer non seulement sur des 
nombres, au sens très général qui vient d’être évoqué, 
mais aussi sur des transformations géométriques : ses 
recherches sont à l’origine de la topologie (voir p. 127). 


• Le courant arithmétique est lié, lui aussi, aux 
travaux de Gauss (à partir de 1801). Le mathématicien 
allemand envisageait une algèbre portant sur des 
notions plus abstraites encore que les nombres 
complexes ou les transformations géométriques. Il 
aboutit à la théorie des nombres algébriques et aux 
recherches arithmétiques de Dirichlet, Dedekind, Küm- 
mer, Kronecker, Hilbert, à la fin du XIX e siècle (intro¬ 
duction des idéaux et notion de corps commutatifs). 
Ces travaux débouchent, au XX e siècle, sur l 'algèbre 
commutative et la géométrie algébrique. 

L’acte de naissance officiel de l’algèbre moderne est 
la publication par le mathématicien allemand E. S. 
Steinitz, en 1910, d’un mémoire intitulé Algebraische 
Théorie der Kôrpern (Théorie algébrique des corps, 
Journal de Crelle, tome CXXXVII, pp. 167-309) ; 
l’auteur, renonçant à décrire tel ou tel corps particulier 
(un corps est un ensemble dont les lois seront étudiées 
plus loin, p. 43), y expose les propriétés d’éléments 
abstraits telles qu’on peut les déduire de certaines 
propriétés fondamentales posées a priori comme des 
axiomes. 
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LA THÉORIE DES ENSEMBLES ET L'INFINI 



Cantor, en équilibre sur un aleph — nombre 
cardinal caractérisant la puissance d'un ensemble 
— entre l’infini; représenté par Dieu sur son nuage, 
et Kronecker, qui a durement critiqué les théories de 
Cantor sur l’infini (caricature de Barbe). 


Problèmes en suspens. 

Au cours de la première moitié du XIX e siècle, les 
mathématiciens sont donc parvenus graduellement à 
cette idée que l’objet le plus général des mathémati¬ 
ques était l’étude des relations entre des objets abs¬ 
traits, définis par des axiomes et sans rapport néces¬ 
saire avec une réalité expérimentale quelconque. 
« Faire des mathématiques », c’est donc calculer, 
combiner selon des règles générales énoncées dans 
les axiomes qui sont à la base de telle ou telle théorie. 
Que, dans certains cas, il puisse y avoir une certaine 
correspondance entre ces objets, ces relations, ces 
calculs et le monde de la perception commune n’ajoute 
ni n’ôte rien à la consistance des mathématiques ; c’est 
simplement une façon commode d’appréhender le 
monde en question. Dès lors les grands problèmes en 
suspens vers 1870 peuvent être énumérés comme suit. 

1-11 faut énoncer avec rigueur les axiomes qui 
sont à la base de chacune des grandes théories 
mathématiques : géométrie, théorie des nombres 
entiers, théorie des nombres en général, algèbre, 
analyse, etc. Ce travail d’axiomatisation, commencé 
par Leibniz au XVII e siècle (la notion de caractéristique 
universelle), se développe à partir de 1850 
environ, avec les logiciens et les mathématiciens 
anglo-saxons (Augustus De Morgan, George Boole, et, 
plus tard, W. S. Jevons, C. S. Peirce) et l’Allemand 
Hermann Hankel. Il s’épanouit, à la fin du XIX e siècle et 
au début du XX e siècle, avec F. L. G. Frege, Peano, 
Hilbert, Bertrand Russell et A. H. Whitehead, etc. 

2 - Une autre idée qui fait petit à petit son 
chemin dans l’esprit des mathématiciens est celle 
d 'isomorphisme (en grec isos = « égal » ; 
morphê = « forme »). Déjà Leibniz avait signalé l’exis¬ 
tence d’une certaine correspondance entre l’addition 
et la multiplication, qui sont des opérations isomor¬ 
phes en ce qui concerne les nombres réels. Par la 
suite, on a compris qu’on pouvait passer d’une théorie 
à une autre, portant sur des objets différents, en 
changeant simplement de langage (sans référence aux 
objets considérés). Ainsi, en géométrie projective, on 
démontre des théorèmes à double face en transfor¬ 
mant une figure selon des règles appropriées ; par 
exemple à des droites concourantes peuvent corres¬ 
pondre, par une transformation dite « par polaires 
réciproques » des points alignés, et vice versa). 

Nous verrons plus loin comment la notion d’isomor¬ 
phisme est comprise dans la notion plus générale et 
très importante de structure. 

3 - Jusqu’au XIX e siècle, le modèle mathémati¬ 
que par excellence était le modèle géométrique : le 
besoin de rapporter les nombres réels à des grandeurs 
(longueurs de segments), de représenter géométrique¬ 


ment des notions comme celles de nombres comple¬ 
xes, de dérivées d’une fonction, etc., correspond à 
cette géométrisation des mathématiques. A partir de 
1820/1830, on assiste à un mouvement inverse. On 
cherche (Grassmann, Hankel, Weierstrass, Dedekind, 
Méray, Cantor) à éliminer l’intuition de grandeurs 
géométriques de l’analyse et à fonder celles-ci sur une 
définition rigoureuse des nombres réels, eux-mêmes 
fondés sur la notion de nombres entiers. C’est ce qu’on 
appelle Varithmétisation des mathématiques. 

4 - L’arithmétique elle-même, considérée 
comme le modèle par excellence de toute théorie 
mathématique, se devait d’être rigoureusement axio- 
matisée. Ce fut là l’œuvre principale de Dedekind 
(1888) et de Peano. 

5 - Les difficultés logiques rencontrées dans le 
domaine de la géométrie, de l’algèbre, de l’analyse et 
de l’arithmétique ont été résolues par une théorie 
générale, élaborée entre 1872 et 1895 par le mathéma¬ 
ticien allemand d’origine russe Georg Cantor, et qui se 
nomme la théorie des ensembles. Toute théorie mathé¬ 
matique traite d’objets abstraits qui constituent des 
ensembles (avant Cantor, on parlait souvent de clas¬ 
ses) : l’ensemble des nombres entiers, l’ensemble des 
réels, l’ensemble des nombres complexes, l’ensemble 
des polynômes, etc. sont des exemples d’ensembles au 
sens de la définition célèbre (... et critiquée) de Cantor : 

« Par ensemble on entend un groupement en un tout 
d’objets bien distincts de notre intuition ou de notre 
pensée. » 

Cantor a approfondi cette notion d’ensemble, mon¬ 
tré comment les diverses difficultés des mathémati¬ 
ques pouvaient être résolues grâce à elle et il a mis fin, 
ce faisant, à des querelles logiques qui menaçaient 
l’édifice mathématique tout entier. 


De la théorie des ensembles 
à la métamathématique. 

Infini actuel et infini potentiel. 

Les mathématiciens et les non-mathématiciens 
s’occupent continuellement d’ensembles d’objets, 
sans éprouver le besoin de réfléchir sur ces ensembles 
eux-mêmes. Les lieux géométriques des anciens Grecs 
(... et aussi des écoliers !) sont des « ensembles de 
points » possédant une même propriété ; on parle 
couramment de « l’ensemble des valeurs de la 
variable » comprises entre deux valeurs limites, a et b , 
etc. De temps à autre, un savant s’interrogeait sur l’un 
de ces ensembles et y rencontrait bien souvent des 
paradoxes inquiétants. L’un des premiers en date est le 
paradoxe de Galilée. 

Considérons la suite infinie des nombres entiers 
naturels : 1, 2, 3, 4, ... n, n + 1, ... « Il va de soi » qu’elle 
est infinie, puisqu’on peut toujours ajouter une unité à 
tout nombre donné à l’avance, aussi grand soit-il : cet 
infini est appelé par les mathématiciens et les philoso¬ 
phes un infini potentiel, parce qu’il n’est pas donné 
réellement, avec tous ses éléments, mais seulement 
« en puissance », sous la forme d’une règle de compo¬ 
sition. Chacun de ces nombres entiers n possède un 
carré, n 2 , et l’on peut écrire les deux suites l’une 
au-dessous de l’autre : 

Suite n : 1, 2, 3, 4, ... n , (n + 1), ... 

Suite n 2 : 1, 4, 9, 16, ... n 2 , (n + 1) 2 ... 

Puisque à chaque entier n correspond un nombre n 2 , 
on peut dire qu’il y a autant de carrés parfaits que de 
nombres entiers : mais alors que fait-on du bel axiome 
que « le tout est plus grand que la partie » ? L’ensem¬ 
ble des carrés parfaits ne représente pas tous les 
entiers et cependant il y a autant de carrés parfaits que 
de nombres entiers. Nous voici donc en présence d’un 
paradoxe. Il en existe bien d’autres lorsqu’on s’inter¬ 
roge sur les ensembles infinis, c’est-à-dire lorsqu’on 
cesse de les considérer comme des infinis 
« possibles » (potentiels), pour les considérer comme 
des infinis réalisés, ou, comme on dit en mathémati¬ 
ques, des infinis actuels. 

Conclusion (avisée) de Galilée : méfions-nous de 
l’infini actuel comme de la peste, et interdisons aux 
mathématiciens de s’en occuper. Deux mille ans plus 
tôt, les philosophes éléates en étaient arrivés au 
même point en essayant de comprendre comment 
Achille pourrait rattraper une tortue, et trois cents ans 
plus tard, en 1833, Cauchy citera ce paradoxe et 
félicitera Galilée de sa prudence. 

Or il est des chapitres entiers d’analyse qui condui¬ 
sent à considérer l’infini actuel, ou, tout au moins, des 
ensembles exceptionnels, comme menant à des para¬ 


doxes de ce genre. Nous ne les étudierons pas ici, car 
nos lecteurs ne sont pas nécessairement des mathé¬ 
maticiens. Mais nous pouvons en signaler quelques 
titres : étude approfondie des fonctions de variables 
réelles (ces mêmes fonctions dont les lycéens connais¬ 
sent les plus simples... celles qui ne posent pas de 
problèmes, et qui leur font croire que toutes les 
mathématiques sont inéluctables), étude des séries 
trigonométriques, définitions des nombres irration¬ 
nels, de la continuité d’une fonction, etc. 

L’analyse, plus spécialement la théorie des fonctions 
continues, et ses diverses extensions, était donc bâtie 
sur un terrain logique peu solide. Tout s’était très bien 
passé jusqu’au début du XIX e siècle, mais, à ce 
moment-là, les difficultés et les paradoxes se sont 
multipliés. C’est pour les éliminer que le mathémati¬ 
cien russe Cantor a élaboré, entre 1872 et 1895, la 
théorie des ensembles, qui, en reconsidérant la totalité 
des notions jusque-là développées séparément, a 
donné à l’algèbre moderne et à l’analyse la base 
rigoureuse qui leur manquait, les garantissant contre 
toute « surprise » à venir. Selon une expression due à 
Hilbert, Cantor avait créé un véritable paradis pour 
mathématiciens, et ceux-ci étaient bien décidés à ne 
pas s’en laisser chasser. 

La crise des mathématiques. 

Il s’en est fallu cependant de peu que ce paradis ne 
se transformât rapidement en un paradis perdu. En 
1895, la théorie des ensembles est achevée. En 1897, 
au premier congrès international des mathématiciens, 
à Zurich, elle est officiellement adoptée, en raison 
notamment des conséquences importantes qu’on en 
tire et de son application immédiate en analyse. Et 
pourtant, dès 1897, l’Italien Burali-Forti, en mettant en 
évidence un certain paradoxe de la théorie, ouvrait une 
crise qui ne devait se terminer que dans les années 30. 

• Les ensembles paradoxaux. Acceptons la 
définition célèbre d’un ensemble donnée par Cantor : 
« un groupement en un tout d’objets bien distincts de 
notre intuition et de notre pensée », bien que celle-ci 
soit, pour les mathématiciens actuels, trop vague et 
insuffisante. Elle pose la distinction entre un ensemble 
et les éléments qui composent cet ensemble. Par 
exemple, « un sac de billes » est un ensemble dont les 
billes sont les éléments ; la suite des nombres entiers 
positifs est un ensemble dont chaque nombre, 1, 2, 
etc., est un élément ; etc. La définition de certains 
ensembles, nous allons le voir, conduit à des parado¬ 
xes insolubles ; on les appelle des ensembles parado¬ 
xaux. 

— Premier exemple. Considérons la totalité des 
notions morales, juridiques, sociales, etc. de l’huma¬ 
nité ; leur ensemble constitue les Sciences humaines ; 
nous le désignerons par la lettre S. Il ne tient qu’à nous 
de décréter : « S est lui-même une notion morale (ou 
juridique, ou etc.) » ; dans ce cas Vensemble S se 
contient lui-même comme élément. Considérons main¬ 
tenant l’ensemble A des ensembles a qui ne se 
contiennent pas eux-mêmes comme éléments (c’est-à- 
dire qui ne se comportent pas comme S) et deman¬ 
dons-nous : « A se contient-il lui-même ? ». Nous pou¬ 
vons répondre à cette question par « oui » ou par 
« non ». Examinons les conséquences de ces deux 
réponses. 

1 - Si nous répondons « non, A ne se contient 
pas lui-même », cela signifie que A est un a, donc un 
ensemble contenu dans A, ce qui est en contradiction 
avec notre réponse « non ». 

2 - Si donc nous répondons « oui, A se contient 
lui-même », cela signifie que A est un élément de A, 
donc un a : mais, précisément, un a ne peut se 
contenir lui-même, ce qui est en contradiction avec la 
réponse « oui ». 

3 - Conclusion : la question posée à propos de 
l’ensemble A ne peut recevoir ni la réponse oui, ni la 
réponse non. 

— Deuxième exemple (paradoxe de J. Richard). 
Ce paradoxe a été exposé dans un article de la Revue 
générale des Sciences pures et appliquées (1905, 
pp. 541 -543), sous le titre Les principes des mathémati¬ 
ques et le problème des ensembles ; nous en donnons 
un exposé simplifié, selon N. Bourbaki. 

1 - Considérons l’ensemble B des entiers b dont 
la définition peut s’exprimer en moins de seize mots 
français. Cet ensemble comprend un nombre fini d’élé¬ 
ments. 

2 - Considérons maintenant la définition sui¬ 
vante d’un entier b' : « le plus petit entier qui n’est pas 
définissable en moins de seize mots français ». De 
toute évidence, b' ne peut appartenir à B, puisqu’il 
faut, d’après le contenu de sa définition, plus de seize 
mots pour le définir. Mais, d’autre part, sa définition, 
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donnée entre guillemets, ne comprend que quinze 
mots français, ce qui permet de placer b' dans l’ensem¬ 
ble B. 

Autrement dit, b' appartient et n’appartient pas, en 
même temps, à l’ensemble B, selon que l’on considère 
le nombre de mots qui le définit, ou le sens des mots 
qui le définissent. B est un ensemble paradoxal. 

Le lecteur qui a fait l’effort de nous suivre jusqu’à ce 
point est sans doute déconcerté. Quoi, pensera-t-il, 
voilà à quoi « jouent » les mathématiciens ? Au lieu de 
se réjouir de ce que la théorie des ensembles, en 
coiffant toutes les mathématiques modernes, achève le 
grand mouvement d’unification souhaité par Descar¬ 
tes, et en particulier l’arithmétisation de la géométrie, 
de ce qu’elle confère aux mathématiques un caractère 
déductif d’une très haute rigueur, au lieu de l’utiliser 
pour résoudre le plus grand nombre possible de 
questions encore pendantes en analyse, ils se posent 
des problèmes bizarres sur les ensembles qui se 
contiennent eux-mêmes ou qui ne se contiennent pas 
en même temps, ou sur les éléments qui sont à la fois 
contenus et non contenus dans un ensemble ! Cela ne 
semble pas très « sérieux ». Pour répondre au lecteur 
étonné, donnons la parole au mathématicien allemand 
Weyl ( Mathematische Zeitschrift , 10, 1921) cité par F. 
Gonseth, Les fondements des mathématiques, Paris, 
1926, p. 189 : 

« On considère généralement les antinomies de la 
théorie des ensembles comme des escarmouches qui 
n’intéressent que les confins les plus extrêmes de 
l’empire des Mathématiques, et qui ne menacent en 
aucune façon la sécurité et la solidité de l’empire 
lui-même... Mais en fait... il faut interpréter ces irrégu¬ 
larités dans les régions frontières des mathématiques 
comme des symptômes ; c'est par là que vient au jour 
le mal secret que cache le jeu en apparence parfait des 
rouages dans les domaines centraux, et qui est l’incon¬ 
sistance et le manque de solidité des fondements sur 
lesquels tout l’empire est assis. » 

• La nature des notions mathématiques. Pour 
résoudre ces paradoxes, sans perdre les avantages 
indiscutables procurés par la théorie des ensembles, 
les mathématiciens entreprirent d’explorer plus à fond 
— entre 1900 et 1936 environ — les fondements des 
mathématiques. Il est impossible d’indiquer ici, techni¬ 
quement, les résultats auxquels ils sont parvenus ; 
nous nous limiterons à décrire les principales tendan¬ 
ces exprimées. 

— Les formalistes (Zermelo, Fraenkel, von Neu¬ 
mann, Skolem, Bernays, Gôdel, Hilbert) éliminent le 
problème. La théorie des ensembles, comme toute 
autre théorie mathématique, comporte des principes 
fondamentaux — des axiomes — et des déductions à 
partir de ces axiomes ; il suffit d’introduire un axiome 
supplémentaire décrétant que les ensembles parado¬ 
xaux sont éliminés de la théorie des ensembles, et le 
problème est résolu. Pour un formaliste, l’exactitude 
d’une proposition résidant dans la correction de la 
déduction (respect des axiomes et des règles logi¬ 
ques), la théorie des ensembles devient donc exacte à 
partir du moment où l’on a mis « hors jeu » les 
ensembles paradoxaux. En d’autres termes, le forma¬ 
liste se désintéresse (théoriquement) du contenu de 
ses raisonnements. Il est dans la situation d’un joueur 
de tennis qui cesse de regarder la balle lorsqu’elle 
rebondit en dehors des lignes : en décrétant « out » les 
ensembles paradoxaux, les formalistes conservent 
bonne conscience. 

Il faut dire que ce point de vue — qui rompt avec la 
tradition millénaire de l’existence d’une réalité mathé¬ 
matique explorée et découverte par l’activité inces¬ 
sante de l’esprit — n’a pas entraîné l’adhésion una¬ 
nime. Russell, Whitehead, pour ne citer que ces grands 
noms, ont tenté de justifier la mise hors jeu des 
ensembles paradoxaux et non pas, simplement, de la 
poser comme un axiome. Quant à savoir s’ils ont 
réussi, c’est une autre affaire !... 

— Les non-formalistes refusent ce qu’ils appel¬ 
lent une abdication de l’esprit. L’étude d’un objet 
mathématique — qu’il s’agisse d’un nombre, d’un 
ensemble ou d’une figure — doit s’accompagner de la 
garantie que cet objet existe, non pas, certes, concrè¬ 
tement, parce que cela restreindrait curieusement 
l’ambition des mathématiques, mais intellectuellement. 
Ainsi, Poincaré, qui fut l’un des grands adversaires du 
formalisme, considérait que le passage d’un nombre 
au suivant (de n - 1 à n) était une sorte de pouvoir inné 
de l’esprit humain et non une convention imposée par 
la règle du jeu axiomatique, et que c’était sur ce 
pouvoir qu’il fallait bâtir l’édifice arithmétique et ses 
prolongements que sont l’algèbre et l’analyse. 

Dans le sillage de Poincaré, l’école française de 
mathématiques devait, au début du XX e siècle, criti¬ 
quer la méthode formaliste (du moins dans ses excès) 
et les constructions axiomatiques. Tel fut le cas — à 



David Hilbert , mathématicien allemand (1862- 
1943) qui a dominé l’école mathématique alle¬ 
mande dans la première partie du XX 0 siècle. Ses 
Fondements de la géométrie (1899) sont un 
ouvrage capital pour la formation de l’axiomatique 
moderne. 


des degrés plus ou moins importants — pour Émile 
Borel, Baire, Jacques Hadamard, Lebesgue, etc. Mais 
les objections soulevées n’étaient pas systématiques ; 
elles portaient sur telle ou telle construction formelle et 
n’abordaient pas le problème de front, comme le fit le 
Néerlandais Brouwer à partir de 1913. Pour ce dernier, 
le fondement ultime des mathématiques est l’intuition 
première de la suite des nombres entiers et naturels, 
intuition intraduisible dans le langage axiomatique. 
Balayant ainsi tous les espoirs des formalistes, Brou¬ 
wer insiste sur le fait que l’exactitude d’une déduction 
mathématique provient, en définitive, de l’évidence 
immédiate et intuitive de ses parties et non du respect 
de règles posées à l’avance. Il a tenté d’instaurer ce 
qu’on appelle une mathématique intuitionniste, qui 
aurait eu pour conséquence le rejet de la théorie des 
ensembles et de toute une partie de l’algèbre moderne. 
La critique intuitionniste, exposée sous une forme 
logique par Heyting, n’a pas été retenue, mais elle a eu 
le mérite d’être perspicace, et d’imposer aux mathéma¬ 
ticiens de réfléchir davantage sur les fondements de 
leur science. 

La métamathématique. 

Après cet ouragan, il fallait bien choisir une voie 
sûre. Le plus « poincariste » des mathématiciens 
n’aurait pas accepté, en 1930, d’abandonner la théorie 
des ensembles sous le seul prétexte qu’il existait « aux 
confins de l’empire des mathématiques », comme le 
disait Weyl, des ensembles paradoxaux. La théorie 
rendait, quotidiennement, trop de services à l’analyse 
pour être mise en réserve. Pour sauvegarder l’édifice 
des mathématiques classiques, ce mathématicien était 
prêt à faire quelque entorse à son anti-formalisme. 
Après tout, il était toujours possible de se 
« raccrocher » au modèle arithmétique. Les mathéma¬ 
ticiens ont donc « oublié » l’intuitionnisme et sont 
retournés à leurs théories, en acceptant, bon gré mal 
gré, d’en limiter parfois la portée. 

• Mais l’arithmétique est-elle une planche de 
salut solide ? Ne risque-t-on pas, en l’approfondissant, 
d’y découvrir des contradictions qui feront sauter le 
dernier refuge de notre raison ? C’est pour résoudre ce 
problème de la non-contradiction de l’arithmétique 
que Hilbert a développé une théorie qu’on appelle la 
métamathématique, dont on comprendra le rôle en 
examinant l’escalade logique suivante : 

— Première étape : la géométrie euclidienne, 
partant de principes traduisant en langage axiomati¬ 
que l’expérience spatiale de tout un chacun, aboutit à 


un ensemble de propositions qu’on peut appeler, au 
sens large, une théorie ; nous l’appellerons Théo¬ 
rie GE (G pour Géométrie, E pour Euclide). 

— Deuxième étape : Lobaôevskij, Bolyai, Rie- 
mann découvrent qu’on peut raisonner en géométrie 
sans tenir compte de l’axiome d’Euclide (appelé autre¬ 
fois « postulat des parallèles ») ; à partir d’un ensemble 
de principes excluant cet axiome, ils construisent les 
géométries non-euclidiennes, que nous noterons 
Théorie GNE. 

— Troisième étape : comment être certain que 
Théorie GNE ne contient pas, en germe, quelque 
contradiction ? La réponse à cette question a été 
donnée par Beltrami (1868) : Théorie GNE est la tra¬ 
duction, en diverses langues géométriques, de Théorie 
GE ; il suffit donc de s’assurer de la non-contradiction 
de Théorie GE. 

— Quatrième étape : depuis Descartes, on sait 
que toutes les propositions constituant Théorie GE 
peuvent être exprimées sous une forme analytique 
^ (algébrique). La non-contradiction de Théorie GE est 
■§ donc assurée par la non-contradiction de l’analyse. 

| — Cinquième étape : mais l’analyse, en y 

5 incluant la théorie des ensembles, s’est révélée contra- 
5 dictoire à partir de 1897, ce qui invalide, en principe, 
| toutes les étapes précédentes, sauf si Ton accepte de 
g limiter la théorie des ensembles par une axiomatique 
| convenable. 

| — Sixième étape : l’analyse, même exposée 

2 comme un système formel S, ne peut renvoyer à un 
| autre système qui en serait le modèle, comme Théorie 
| GE était le modèle de Théorie GNE. On doit donc 
Q renoncer à prouver sa non-contradiction par le moyen 
. d’un modèle. 

£ 

• La méthode proposée par Hilbert est la sui¬ 
vante : une théorie mathématique est cohérente si elle 
est libérée de la contradiction. Pour s’assurer de cela, 
il faut établir la liste : 1° de toutes les propositions 
(axiomes ou théorèmes) constituant la théorie ; 2° de 
toutes les propositions de la logique (principes et 
règles de raisonnement) utilisées par la théorie. Cela 
fait, il faut montrer qu’aucune déduction n’aboutit à 
deux théorèmes dont l’un serait la négation de l’autre. 

Autrement dit, il s’agit d’examiner Vaspect formel du 
système S, indépendamment de son contenu (de sa 
signification), et de faire de ces formes l’objet d’une 
métathéorie (méta = « après»), qu’on appellera une 
métamathématique si S est un système mathémati¬ 
que ; cette métamathématique est une théorie de la 
preuve. 

Une étude de la métamathématique dépasserait le 
cadre de ce livre. Retenons-en simplement quelques 
problèmes importants : 

— le problème de \'indépendance des proposi¬ 
tions constituant un système d’axiomes ; 

— le problème de la catégoricité d’une théorie 
(une théorie est dite catégorique si, pour toute propo¬ 
sition p de cette théorie, l’une des deux propositions p 
ou non-p est un théorème de cette théorie). Ce pro¬ 
blème a conduit à des solutions négatives (Gôdel), 
c’est-à-dire qu’on a essentiellement démontré que 
certaines théories n’étaient pas catégoriques. 

— Le problème de la décision rejoint les préoc¬ 
cupations de Leibniz à propos de la Caractéristique 
(langage logique) universelle. Voici comment N. Bour¬ 
baki l’énonce : 

« ... II s’agit de savoir si, pour un langage formalisé 
donné, on peut imaginer un « procédé universel » 
quasi mécanique qui, appliqué à n’importe quelle 
relation du formalisme considéré, indique... si cette 
relation est vraie ou non » (N. Bourbaki, Théorie des 
ensembles, Hermann, Paris, 1970, E.IV.75). 

Le dernier mot semble être revenu (provisoirement) à 
Gôdel ; il a démontré (théorème de Gôdel) en 1931 : 
1° que l’arithmétique est non catégorique ; 2° qu’il est 
impossible de prouver par la méthode hilbertienne la 
non-contradiction de toute théorie contenant l’arith¬ 
métique. 

Une démonstration, par une méthode non hilber¬ 
tienne, de la non-contradiction de l’arithmétique for¬ 
malisée a été donnée en 1936 par Gentzen. 

• Est-ce là un échec ? Doit-on conclure que la 
non-contradiction ne se démontre pas, mais qu’elle se 
constate, et que les métamathématiques ne font pas 
partie intégrante des mathématiques ? Peut-être. Mais 
ce n’est pas là une raison suffisante pour renoncer à 
tout exposé logique et formaliste du savoir mathémati¬ 
que, puisque le formalisme est, en dernière analyse, un 
moindre mal. Prenant, dans une certaine mesure, le 
contre-pied des thèses de Poincaré (mort en 1912), 
l’école mathématique française a entrepris, à partir des 
années 20, un vaste programme de recherches et 
d’expositions formelles, qui ont été publiées sous le 
nom collectif de Nicolas Bourbaki. 
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NOTIONS FONDAMENTALES 
SUR LA THÉORIE DES ENSEMBLES. 

Définition et opérations 
sur les ensembles. 

Les ensembles. 

• Au sens « naïf », c’est-à-dire sans se préoccu¬ 
per de très difficiles problèmes de logique formelle, 
le mot « ensemble >> est employé en mathémati¬ 
ques comme synonyme de « collection », « bande », 
«totalité», etc. Le mathématicien ne dit pas «une 
équipe de rugby », mais « un ensemble de joueurs 
de rugby » ; la « mafia » est « un ensemble de 
gangsters » ; le Code civil est un « ensemble de lois » ; 
la suite infinie des nombres entiers naturels est 
l’« ensemble des entiers naturels», etc. 

Ce que nous venons de dire ne constitue pas une 
définition, au sens rigoureux, de la notion d’ensemble, 
mais une banale remarque de vocabulaire. Cantor s’en 
contentait et la définition formelle des ensembles est 
trop ardue et trop abstraite pour être signalée ici (voir 
N. Bourbaki, Théorie des ensembles, Paris, Hermann, 
1970). 

• Notation. Un ensemble est noté par une lettre 
majuscule : A, B, C ,... En français, on emploie souvent 
la lettre E (initiale du mot « ensemble ») ; en anglais, la 
lettre S (initiale de set = « ensemble ») ; en allemand, 
la lettre M (initiale de Menge= « ensemble »). 

Les éléments d’un ensemble sont désignés par des 
lettres minuscules : a, b, c, ... ; un élément quelcon¬ 
que, non spécifié, se désigne souvent par x. 

Pour écrire qu’un objet est un élément d’un ensem¬ 
ble E, on utilise le signe « G », dont la négation est 
« <£ » : 

— x G E, s’énonce « x appartient à E » ou « x 
est un élément de E » ; 

— x£ E s’énonce « x n’appartient pas à E » ou 
« x n’est pas un élément de E ». 

• Ensemble vide. Un ensemble qui ne contient 
aucun élément est appelé ensemble vide ; on le dési¬ 
gne par le symbole « 0 ». Par exemple, l’ensemble des 
hommes immortels est l’ensemble vide 0 ; l’ensemble 
des triangles à quatre côtés est l’ensemble vide 0. 

• Ensembles finis. Nous n’avons pas encore 
défini la notion de nombre naturel, mais elle est 
intuitivement connue de tous et nous allons nous en 
servir pour compter les éléments d’un ensemble. Ce 
comptage peut être réalisé avec exactitude dans cer¬ 
tains cas : il y a neuf planètes dans le système solaire, il 
y a cinq nombres pairs inférieurs ou égaux à 10, il y a 
vingt-six lettres dans l’alphabet. Dans d’autres cas, il 
ne peut être qu’estimé : le nombre de grains de sable 
de la plage de Deauville est sans doute très grand, et il 
est impossible de l’établir exactement, mais c’est de 
toute façon un nombre fini. 

Appelons donc a v a 2 . a n les éléments d’un 

ensemble contenant un nombre n fini d’éléments, n 
étant connu avec rigueur ou estimé (lire « a-un », 
« a-deux », ... « a-n ») et E l’ensemble de ces élé¬ 
ments. Cet ensemble est dit fini et s’écrit : 

E={a„a s . a„}. (1) 

• Ensembles infinis. En mathématiques, nous 
rencontrerons des ensembles dont les éléments ne 
sont pas en nombres finis : l’ensemble des nombres 
entiers, l’ensemble des points d’une droite, sont des 
exemples d 'ensembles infinis. Le traitement de ces 
ensembles pose des problèmes délicats, qui seront 
examinés plus loin. 

• Description d’un ensemble. Pour définir un 
ensemble particulier, on peut utiliser plusieurs procé¬ 
dés, nous en retiendrons deux : 

1 - la façon la plus simple est d’énumérer tous 
ces éléments, par exemple : 

E = { 2, 4, 6, 8, 10} ; (2) 

E = {1,2, 3 } ; (3) 

2 - on peut aussi énoncer la/les propriétés 
caractéristiques des éléments de l’ensemble consi¬ 
déré, ainsi l’ensemble E ci-dessus est l’ensemble des 
nombres pairs inférieurs ou égaux à 10, et peut se 
décrire par : 

E ={ x entier, pair et «10}. (4) 

Quant à l’ensemble F, c’est l’ensemble des entiers 
dont le carré est inférieur à 16, donc : 

F = { x entier I x 2 < 16}. (5) 

Bien entendu, nous rencontrerons en mathémati¬ 
ques des ensembles plus compliqués que les deux 


ensembles E et F qui viennent d’être définis : l’ensem¬ 
ble des racines d’une équation du n-ième degré, 
l’ensemble des entiers x, y, z qui vérifient la relation 
x n + y n = z n , l’ensemble des fonctions d’une variable 
réelle, etc. L’étude des propriétés de ces ensembles 
peut occuper plusieurs vies de mathématiciens ! 

Ensembles et sous-ensembles. 

• Notion de sous-ensemble. Soit E un ensem¬ 
ble, défini de quelque manière que l’on voudra, et X un 
ensemble dont tous les éléments appartiennent à E : 
on dit alors que X est un sous-ensemble de E. 

Exemple : soit E l’ensemble des entiers naturels : 

E = {1,2, 3,...} (6) 

et soit X l’ensemble défini par : 

X = {entiers multiples de 3 < 435 }. (7) 

Nous dirons que X est un sous-ensemble de E, car tous 
ses éléments appartiennent aussi à E. De même 
X = {les triangles } est un sous-ensemble de E = {les 
polygones}; X={les Mammifères} est un sous- 
ensemble de E = {les Vertébrés } ; etc. 

• Inclusion stricte. Si X est un sous-ensemble 
de E différent de E, on dit qu’il est strictement inclus 
dans E et l’on écrit : 

X C E (« X est strictement inclus dans E ») 
ou ED X (« E contient strictement X »). 

• Inclusion. Si X est un sous-ensemble de E, 
mais si l’on ne précise pas qu’il doit être différent de E, 
on ne parle pas d’inclusion stricte, mais simplement 
d 'inclusion. On écrit alors : 

XQE («X est inclus dans E) 
ou E D X (« E contient X »). 

• Remarques : 

1 - La négation de l’inclusion, stricte ou géné¬ 
rale, est marquée par le symbole « (f. » ou « ÇZS> ; 

2 - Certains auteurs emploient, pour l’inclusion 
(C) le symbole de l’inclusion stricte (C) : ce procédé est 
à déconseiller. 

3 - On s’aide parfois de schémas pour représen¬ 
ter des ensembles ( diagrammes de Venn). Ainsi l’inclu¬ 
sion stricte B c A se représente par le schéma de la 
figure ci-dessous. 



Diagramme de Venn représentant l’inclusion stricte 
B c A. Chaque ensemble , A ou B, est représenté par 
une surface au contour fermé. 


4 - Un procédé courant pour définir un 
sous-ensemble X d’un ensemble E consiste à définir X 
comme l’ensemble des éléments x appartenant à E et 
possédant la propriété P. On écrit alors, convention¬ 
nellement : 

X = { x G EI P(x) vraie }, (8) 

le symbole P(x) se lisant « x possède la propriété P ». 

Partition d'un ensemble. 

Étant donné un ensemble E, on peut classer tous les 
éléments de cet ensemble en sous-ensembles de E ; 
cette opération s’appelle partition de l’ensemble E. 
L’ensemble de tous les sous-ensembles est nommé 
ensemble des parties ou encore booléen de E (par 
référence au mathématicien britannique George 
Boole). On le désigne par le symbole s 4J(E) ou J'(E). 

Un exemple concret va nous faire comprendre le 
processus de partition d’un ensemble. Supposons, 
qu’un cuisinier nous demande ce que nous désirons 
comme menu pour un dîner, sachant qu’il peut nous 
offrir trois plats que nous désignerons., pour simplifier 
les explications ultérieures, par lès lettres a, b et c : 
des huîtres (a), un civet de lièvre (b) et un sorbet (c). Il 
nous propose donc l’ensemble des plats E = { a, b, c) 
et nous prie d’écrire sur un carton le menu désiré. 
Examinons toutes les possibilités. Nous pouvons 
décider : 

1 - soit de ne rien manger : nous n’inscrivons 
rien sur notre carton, qui figurera, par conséquent, la 


partie vide de E, c’est-à-dire le sous ensemble {0} ; 

2 - soit de ne manger qu’un seul plat : nous 
inscrirons donc « huîtres » sur un carton, « civet de 
lièvre » sur un autre et « sorbet » sur un troisième ; 
chacun de ces trois cartons figurera les sous-ensem¬ 
bles { a}, { b}, { c}, qu’on appelle des singletons car ils 
sont réduits à un seul élément, a, b, ou c ; 

3 - soit de faire honneur à deux plats, d’où les 
sous-ensembles { a, b}, { a, c), { b, c} ; 

4 - soit enfin de choisir le menu complet, c’est- 
à-dire l’ensemble plein { a, b, c}. 

En résumé, l’ensemble E comprend les parties sui¬ 
vantes : 

{0} 

{a} {b} {c} 

{a, b} {a, c} {b, c } 

{a, b, c\. 

L’ensemble ^(E) de ces huit sous-ensembles consti¬ 
tue l 'ensemble des parties de l’ensemble E. 

• Plus généralement, si E est un ensemble fini 
contenant n éléments : 

E = { a„ a 2 , a„) (9) 

l’ensemble des parties S £(E) est composé de l’ensemble 
vide 0, des n sous-ensembles { a : }, { a 2 }, ..., { a n } à un 
élément, des sous-ensembles à deux éléments dis¬ 
tincts, à trois éléments distincts, etc., et de 
l’ensemble E lui-même, à n éléments. On montre que 
le nombre de sous-ensembles contenus dans E, c’est- 
à-dire le nombre d’éléments de l’ensemble des parties 
s |s(E) est alors égal à 2". 

Opérations sur les ensembles. 

Les ensembles sont des êtres mathématiques sur 
lesquels on peut faire trois opérations fondamentales, 
appelées réunion, intersection et complémentation. 
Les règles de calcul permettant l’utilisation de ces 
opérations ont été notamment étudiées par 
A. De Morgan. 

• Égalité. Deux ensembles sont égaux, si tout 
élément de chacun d’eux est élément de l’autre. 

• Réunion. Soit A, B, C, ... des ensembles ; 
l’ensemble S dont chaque élément appartient à l’un au 
moins des ensembles A, B, C, ... est la réunion de ces 
ensembles. Cette opération est désignée par le sym¬ 
bole « U » ; on écrit donc, dans le cas de la réunion de 
deux ensembles A et 6 par exemple : 

S=AUB (10) 

(lire : « S — A union B »). La réunion de deux ensem¬ 

bles est encore appelée somme logique de deux 
ensembles. 

Par exemple, si l’on pose : 

A {entiers naturels multiples de 3 } 

= { 3, 6, 9, ...} (11) 

et 

B = { entiers naturels multiples de 7} M ‘ 
— { 7, 14, 21, ...} 

on a : 

S = A U B = { entiers naturels multiples de 3 

ou de 7 }. (13) 

On peut figurer l’opération de la réunion à l’aide d’un 
diagramme de Venn, comme ci-dessous. 



Réunion de deux ensembles. 

L’ensemble S - A U B est représenté par la totalité 
de la surface bleue. 


• Intersection. On appelle intersection de deux 
(ou de plusieurs) ensembles A et S (ou A, B, C, ...) 
l’ensemble des éléments appartenant à chacun des 
ensembles donnés. Cette opération, qui est aussi 
appelée produit logique (ne pas la confondre avec le 
produit cartésien, qui sera défini p. 22) est notée par le 
symbole « n », et l’on écrit : 

E = A C\ B (14) 

(lire : « E = A inter B »). 
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OPÉRATIONS SUR LES ENSEMBLES 

Par exemple les deux ensembles finis : 

A={ 1, 2, 3, 4, 5, 50} 

B = {5, 10, 15, .... 95, 100} v * 

ont pour intersection : 

E=AD B = { 5, 10, 15, 20, .... 45, 50}. (16) 

L’intersection peut aussi se représenter par un dia¬ 
gramme de Venn (voir figure ci-dessous). L’ensemble E 
(en gris foncé) est l’intersection des deux ensembles A 
et B. 

Si l’intersection A n B est un ensemble vide 0, A et 
B sont dits disjoints. Par exemple l’intersection des 
ensembles A = { 1,2,3} et fî = {4, 5, 6} est l’ensem¬ 
ble vide 0 (A et B n’ont aucun élément commun) : les 
ensembles A et B sont dits disjoints. 



Intersection de deux ensembles. 
L’ensemble E = A n B est représenté par la surface 
foncée centrale. 



Représentation de deux ensembles disjoints A et B. 


• Trace d’un ensemble sur un autre. Soit une 
partie déterminée A d’un ensemble E, et X une autre 
partie de E, mais arbitraire ; on appelle trace de X sur 
A l’ensemble A n X. On considère cette trace comme 
une partie de A. 

• Complémentation. Soit E un ensemble et A un 
sous-ensemble de E. Considérons un élément x de E 
possédant la propriété « x E A » ; l’ensemble des élé¬ 
ments possédant cette propriété est évidemment A. 
Les éléments de E qui ne possèdent pas cette pro¬ 
priété, c’est-à-dire qui possèdent la propriété « x£ A » 
constituent un ensemble appelé complémentaire de A 
dans E. On le note E - A ou C A ou A. Par exemple : 
l’ensemble des Parisiens est un sous-ensemble de 
l’ensemble des Français ; l’ensemble des Français non 
parisiens est le complémentaire de l’ensemble des 
Parisiens. La figure ci-dessous est une image (dia¬ 
gramme de Venn) correspondant à la notion d’ensem¬ 
ble complémentaire d’un autre ensemble. 



E est représenté par le rectangle noir tout entier. A 
n’est autre que la partie grisée du rectangle j_ le 
complémentaire de A dans E est l’ensemble A. 


• Règles fondamentales de calcul. Les opéra¬ 
tions symbolisées par U, n et () ainsi que les relations 
d’égalité et d’inclusion, symbolisées par les signes 
« = » et « c » ou « ç » permettent de calculer sur les 
ensembles à condition de respecter certaines règles, 
énoncées dans le tableau ci-après, dans lequel nous 
avons introduit en outre le symbole « <£> » qui signifie 
« est équivalent à ». 


N° 

Proposition 

Commentaire 

1 

0 = C E 

E = C0 

Résulte de la définition de la complémentation : les 
éléments de l’ensemble E qui ne sont pas contenus dans E 
forment évidemment un ensemble vide ; de même E 
contient tous les éléments qui n’appartiennent pas à 
l’ensemble vide. 

2 

C(C^> = 4 

Le complémentaire du complémentaire d’un ensemble 
redonne cet ensemble. Par exemple en prenant comme 
référentiel l’ensemble E des nombres entiers naturels, et en 
appelant A l’ensemble des pairs , (J4 est l’ensemble des 
impairs, et C(C^) est l’ensemble des pairs. 

3 

A \J A = A, A n A = A 

La proposition n° 3 exprime 1 ' idempotence de la réunion 
et de l’intersection. 

4 

A U (CA) = E, A D (CA) = 0 


5 

A U 0 = A, An E = A 


6 

A U E = E, A n 0 = 0 


7 

A U B = B U A 

A n B = B n A 

Les opérations de réunion et d’intersection sont commu¬ 
tatives: leur résultat ne dépend pas de l’ordre dans lequel 
on considère les ensembles sur lesquels on opère. 

8 

AG (AD B), (AH B) CA 

A est inclus dans l’ensemble formé par la réunion des 
ensembles A et B ; l’intersection AflB est incluse dans A. 

9 

C(A U0) = (CA) D (CB) 

C(A n B) = (CA) u (fis) 

Le complémentaire de l’union est l’intersection des 
complémentaires ; le complémentaire de l’intersection est 
l’union des complémentaires. 

10 

A ce<=>CA D C BoA U B = B 

O A n B = A 


11 

AnB = 0^AcCe«ecCA 


12 

AuB = E«()4C8o(]BcA 


13 

A U (B U C) = (A U B) U C 
= AU BU C 

An(BnC) = (AnB)nc = Anenc 

Ces relations expriment V associativité des opérations de 
réunion et d’intersection ; pour unir A à l’ensemble consti¬ 
tué par l’union de B et C, on peut donc faire d’abord 
l’opération de réunion de A et B, et réunir C au résultat. 

14 

AU(BflC) = (AUB)fl(AUC) 

A n (e u C) = (A n B) u (A n C) 

Ces relations expriment la distributivité de la réunion par 
rapport à l’intersection, et celle de l’intersection par rapport 
à la réunion. Comparer avec la propriété bien connue du 
produit en algèbre élémentaire, qui est distributif par 
rapport à la somme. 

15 

(A C B) entraîne les relations 
(AU C) C (BU C) et (ADC)C(Bn C) 

Cette proposition permet de modifier les deux termes 
d’une inclusion, tout comme, en algèbre élémentaire, on 
peut ajouter ou soustraire une même quantité des deux 
membres d’une égalité. 
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(CC A et CcB)«[Cc(AnB)] 

(ÀC C et BC C)<=>[A U (SC C)] 



Règles fondamentales de calcul sur les ensembles. 
(A et B désignent des sous-ensembles de E) 


Les relations . 

Généralités. 

Lorsque nous disons : « l’oisiveté est mère de tous 
les vices », nous établissons une relation entre le terme 
x = « oisiveté » et le terme y = « tous les vices » ; elle 
est exprimée par la locution « est mère de », qui 
possède un sens bien précis en français (il s’agit bien 
entendu, ici, de son sens figuré). Désignons cette 
relation par la lettre R ; nous écrirons la relation sous 
la forme de : 

Rlx, yl . 

Voici un autre exemple de relation : 

— x = un personnage historique ou légendaire 
(par exemple : Caïn) ; 

— y = un autre personnage historique ou légen¬ 
daire (par exemple : Abel) ; 

— R = « est le frère de ». 

La relation Rlx, y l est vraie pour des couples (x, y) 
d’éléments appartenant à l’ensemble E = {les person¬ 
nages historiques ou légendaires} — comme (Caïn, 
Abel), (Napoléon Bonaparte, Joseph Bonaparte), 
(Romulus, Rémus) — mais elle est fausse pour des 
couples comme (Napoléon, Caïn), (Abel, Romulus), 
etc. : on dit qu’elle est satisfaite dans le premier cas, 
non satisfaite dans le second. 

La relation R f = « est le père de » est satisfaite pour 
des couples (x, y) tels que (Louis XIII, Louis XIV), 
(Adam, Abel), (Adam, Caïn), (Napoléon, duc de Reich- 
stadt), etc. ; mais, si nous y regardons de plus près, 
nous constatons qu’il existe une différence importante 
entre R et R' : on peut permuter x et y sans changer R, 
alors que cette permutation n’est pas possible pour R'. 
On a en effet, identiquement : 

RI Caïn, Abel l = Rl Abel, Caïn l, 
et non pas : 

R'I Louis XIII, Louis XIV = R' SLouis XIV, Louis XIII l, 
car, si « Louis XIII est le père de Louis XIV » est une 


proposition vraie, « Louis XIV est le père de 
Louis XIII » est une proposition fausse. 

Ces premiers exemples nous montrent que toutes les 
relations n’ont pas les mêmes propriétés, et que, si 
nous voulons apprendre à calculer sur elles, c’est-à- 
dire à apprendre à les combiner, il nous faut d’abord 
décrire systématiquement leurs propriétés. 

Propriétés des relations. 

• Réflexivité. Une relation R est dite réflexive si 
et seulement si, quel que soit x dans le domaine où elle 
est définie, on a Rlx, xl. Par exemple la relation 
R = « est diviseur de » est réflexive dans le domaine 
des entiers naturels, car on peut dire de tout entier x 
qu’il est un diviseur de lui-même : 

Rlx , x l —x est diviseur de x. (1) 

De même la relation symbolisée par le signe « = » est 
réflexive, car on a évidemment, quel que soit le 
domaine choisi, x = x. 

• Symétrie. Une relation R est dite symétrique 
si et seulement si, dans le domaine considéré, Rlx, y\ 
entraîne R \ y, xl. Par exemple la relation « est de la 
même famille que » est symétrique puisque « x est de 
la même famille que y » entraîne « y est de la même 
famille que x ». En revanche la relation « est diviseur 
de » n’est pas symétrique pour les entiers naturels, car 
« x est diviseur de y » n’implique pas « y est diviseur 
de x » (sauf si x = y). 

• Transitivité. Une relation est dite transitive si, 
et seulement si, «Rlx, y \ et R \ y, z l entraîne 
Rlx,z\. Exemple: l’égalité (« = »), le parallélisme 
(« Il »), « est diviseur de » sont des relations transiti¬ 
ves, en effet : 

« x = y, y = z»=>x = z; 

« D II D\ D' /I D" » => D II D" ; (2) 

« x est diviseur de y, y est diviseur de z » 

=> « x est diviseur de z » . 

• Antisymétrie. Une relation binaire est dite 
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antisymétrique si et seulement si, «R\x,yî et 
R > s y, x \ » entraîne x = y. 

• Quantificateurs. Soit R ï x, y $ une relation ; 
on peut préciser son champ d’application en disant 
qu’elle est vraie quel que soit x, par exemple, ou bien 
qti’il existe au moins un x tel qu’elle soit vraie. Dans le 
premier cas, on écrit : 

(Vx) R \ x, y \ 
et dans le second cas : 

(3x) R \ x, y \ . 

Les symboles « V >> et « 3 » sont appelés respective¬ 
ment quantificateur universel et quantificateur existen¬ 
tiel ; et le premier se lit « pour tout » ou « quel que 
soit » et le second se lit : « il existe ... tel que » or « il 
existe au moins un ... tel que ». 

Relations d'équivalence. 

• Définition. Une relation binaire % qui est à la 
fois réflexive, symétrique et transitive est appelée 
relation d’équivalence ; on peut l’écrire, comme toute 
relation, % \x, y mais aussi, si l’on veut souligner son 
caractère : 

x = y (mod %), 

qui se lit des trois façons suivantes : 

— x congru à y modulo (= selon le mode) %, 

— x équivalent à y modulo %, 

— x équivalent à y (quand il n’y a pas de 
confusion possible). 

• Exemples. 

1 - Soit % = « est parallèle à », et l’ensemble des 
droites appartenant à un même plan (c’est-à-dire, par 
exemple, l’ensemble de toutes les droites qu’on peut 
tracer sur une feuille de papier supposée indéfiniment 
prolongée dans toutes les directions ; on dit souvent, 
en géométrie : « coplanaires ») ; (x, y) désignant un 
couple quelconque de droites de l’ensemble, et la 
relation « être parallèle à » signifiant, pour deux élé¬ 
ments tels que x et y : « n’avoir aucun point commun 
ou être confondues ». 

La relation %\x, y \ est réflexive (% \ x, x ? est satis¬ 
faite pour tout x, puisqu’une droite est toujours 
confondue avec elle-même), symétrique (si x est paral¬ 
lèle à y, alors y est parallèle à x), et transitive (si x est 
parallèle à y et si y est parallèle à z, alors x est parallèle 
à z) ; il s’agit donc d’une relation d’équivalence et l’on 
peut écrire : 

x = y (mod %). 

2 - Soit dans l’ensemble (les entiers naturels 
et le zéro) la relation % = « la division de x par 3 donne 
le même reste que la division de y par 3 » ; est-ce une 
relation d’équivalence ? 

Assurons-nous d’abord que nous avons bien 
compris la relation proposée. Soit x un entier naturel, 
par exemple 19; la division 19:3 donne comme 
quotient 6 et comme reste 1. Soit y un autre nombre 
entier, par exemple y = 20 ; la division 20 : 3 donne 
pour quotient 6 et pour reste 2. Donc le couple 
U» y) = (19,20) ne vérifie pas la relation considérée. 
Soit maintenant y = 22 ; la division 22 : 3 donne pour 
quotient 7 et pour reste 1 : le couple (x, y) = (19,22) 
vérifie %. Et ainsi de suite. 

La relation % \ x, y \ est réflexive, car il est bien 
évident que « la division de x par 3 donne le même 
reste que la division de x par 3 » ; elle est symétrique, 
car on peut aussi dire que « la division de y par 3 donne 
le même reste que la division de x par 3 » ; elle est 
transitive, car, si x et y donnent le même reste dans 
une division par 3 et si y et z donnent le même reste 
dans une division par 3, alors x et z donnent le même 
reste dans une division par 3 (si 1 est le reste pour x et 
y et si 1 est le reste pour y et z, alors 1 est le reste pour 
x et z ; même raisonnement avec un reste égal à 2). 
Conclusion : la relation % est une relation d’équiva¬ 
lence et l’on peut écrire : 

x = y (mod %). 

3 - Soit dans l’ensemble Z des entiers relatifs 
(entiers positifs et négatifs et 0) la relation : 

x G Z, y G Z, % î x, y\ = « x - y est divisible par 3 » . 

Cette relation est réflexive (x - x = 0 et 0 est divisible 
par n’importe quel nombre), symétrique (puisque le 
calcul algébrique élémentaire nous permet d’écrire : 
x - y = multiple de 3 = 3a=>y - x = -3a = multiple 
de 3) et transitive, puisque, si l’on a : 

x — y = 3 a et y - z = 3 b, 

on a aussi (par addition membre à membre des deux 
égalités), x-z = 3a + 3b. 

Donc on peut écrire : 

x = y (mod %). 


• Remarques : 

— La relation d’équivalence est une généralisa¬ 
tion formelle de la relation d’égalité, et, réciproque¬ 
ment, on peut souvent considérer une égalité comme 
une « équivalence contractée ». Par exemple, les deux 
fractions 3/4 et 6/8 ne sont pas représentées par des 
symboles identiques ; nous n’avons donc pas le droit 
de dire que ces symboles sont égaux. Mais les nombres 
fractionnaires qu’ils traduisent sont égaux : on dira 
que ce sont deux symboles équivalents. 

• Classe d’équivalence. Considérons mainte¬ 
nant un ensemble E muni d’une relation d’équivalence 
(c’est-à-dire tel qu’on a pu définir une relation d’équi¬ 
valence entre deux de ses éléments x et y). Soit a un 
des éléments de E ; on peut lui associer un certain 
nombre d’éléments a v a 2 , ... tels que 

a 1 = a, . a 2 = a,... (mod ^). 

L’ensemble des éléments tels que a 1( a 2 , etc., est une 
partie de E qu’on appelle classe d’équivalence de a et 
qu’on désigne par C(a). 

Exemple : Soit x et y deux entiers relatifs et la 
relation « x—y est divisible par 3 » (voir § c, exemple 
n° 3), qui est une relation d’équivalence ; soit le nom¬ 
bre x = 3 ; on vérifie aisément que les valeurs suivantes 
de y satisfont à la relation considérée : 

..., y = - 15, y = - 12 ... y = 3, y = 6, y = 9,... 

Tous ces nombres sont équivalents à 3 pour la 
relation considérée ; leur ensemble forme la classe 
d’équivalence C(3) ; on démontre facilement, en algè¬ 
bre élémentaire, que ce sont les multiples entiers, 
positifs ou négatifs, de 3 et le nombre 0. Soit ensuite le 
nombre x = 2 ; les nombres y tels que 2 — y soit 
divisible par 3 sont : 

... y = - 16, y = - 13,... y = 2, y = 5, y = 8,... 

et l’on démontrerait tout aussi facilement que leur 
ensemble, qui constitue la classe C(2), est formé de 
multiples de 3 diminués d’une unité (par exemple 
— 16 = — 15—1, etc.). Enfin la classe C(1 ) est compo¬ 
sée des multiples de 3 augmentés de 1 (- 14, - 11, et 
ainsi de suite). 

Cet exemple nous conduit à la remarque suivante : 
un nombre entier relatif quelconque est, soit un multi¬ 
ple de 3, soit un multiple de 3 moins 1, soit un multiple 
de 3 plus 1 ; donc les trois classes d’équivalence que 
nous avons trouvées, C(1), C(2) et C(3), sont les trois 
seules classes possibles dans Z. 

• Ensemble-quotient. D’une manière générale, 
on démontre qu’une relation d’équivalence %, définie 
sur un ensemble E, détermine une partition de E en 
classes d’équivalence, et que, réciproquement, toute 
partition de E définit sur E une relation d’équivalence 
%■ L’ensemble des classes d’équivalence déterminées 
sur E par la relation % s’appelle l’ ensemble-quotient de 
E par % ; on le note E/%. Si l’on a, sur E, a = b (mod %), 
on a C(a) = C(b) dans l’ensemble-quotient E/%. 

Relations d'ordre. 

• Définition. Une relation binaire est appelée 
relation d’ordre lorsqu’elle est réflexive, transitive et 
antisymétrique. Appelons co i x, y\ une telle relation 
(« co » est la dernière lettre de l’alphabet grec ; elle se lit 
« oméga »). En d’autres termes : la relation co \x, y J 
entre deux éléments x et y appartenant à un ensemble 
E est une relation d’ordre dans E si elle est réflexive et 
si : 

— « co \ x, y \ et co J y, z \ » => co I x, z l 

(transitivité) ; 

— « w $ x, y \ et co \ y, x £ » <=> x = y 

(antisymétrie). 

Exemple : soit la relation « » définie dans l’ensem¬ 

ble N des nombres entiers naturels et du zéro ; elle se 
lit « inférieur ou égal à » ; considérons deux nombres x 
et y appartenant à N : 

— la relation « x y et y z » entraîne 

« x z » (transitivité) ; 

— la relation « x y et y=sx» entraîne 

« x = y » (antisymétrie) ; 

— en outre x =s= x (réflexivité). 

Conclusion : la relation « est inférieur ou égal à » est 
une relation d’ordre dans f^J (on dit aussi que N est 
ordonné selon cette relation). Sg 

Remarque : la relation « < », qui se lit « est stricte- § 
ment inférieur à » n’est pas une relation d’ordre, car S 
elle n’est pas réflexive (elle interdit, dans N, l’égalité @ 
x = y). La prise en considération de la réflexivité, dans J 
une relation d’ordre, impose certaines précautions de | 
vocabulaire, ce qui est bien le moins qu’on puisse ^ 
exiger d’un logicien et d’un mathématicien ; par exem- § 


LES RELATIONS 

pie, « est à la gauche de », en parlant des points d’une 
droite, est une relation d’ordre à condition qu’on 
admette que « x est à la gauche de x » signifie « x est 
confondu avec x ». 

Il est fréquent, dans le langage mathématique actuel, 
de lire le symbole « ^ » : « inférieur à » et le symbole 
« < » : « strictement inférieur à », le premier 

n’excluant pas l’égalité entre les deux termes qu’il 
relie. Nous nous conformerons, en général, à cet 
usage, nous réservant de préciser toutes les fois qu’il y 
aura une confusion possible (mais non inévitable...). 

• Notation. Dans un ensemble E quelconque, 

on note souvent une relation d’ordre co \x, y\ par 
x y. Le symbole « » se lit « inférieur ou égal à », 

mais il n’a pas nécessairement la signification usuelle 
(notamment si x et y ne sont pas des nombres). 

• Ordre total et ordre partiel. Quand la relation 
d’ordre considérée relie deux termes toujours compa¬ 
rables par cette relation, l’ordre est dit total. C’est le 
cas de la relation « ^ », puisque, dans N, on a tou¬ 
jours : 

— soit a b ; 

— soit b «s a ; 

— soit les deux relations à la fois si a = b. 
Mais supposons, toujours en restant dans l’ensemble 
N, que l’on considère la relation « est un diviseur de », 
notée par le symbole : « / ». On peut écrire 11/33 (11 
est un diviseur de 33), mais non pas 11/34 : le couple 
(11,34) n’est pas comparable — ni dans un sens, ni 
dans l’autre — par la relation « / ». Par contre, si l’on 
retient tous les couples (a, b) comparables par « / », 
on montre aisément qu’il s’agit d’une relation d’ordre, 
puisqu’elle est transitive, antisymétrique et réflexive : 
la relation « / » est dite d’ordre partiel. 

Majorants et bornes d'un ensemble ordonné. 

Les notions que nous allons maintenant définir 
seront reprises en Analyse, à propos de la théorie des 
fonctions. 

• Ensembles fermés et ensembles ouverts. Soit 
E un ensemble muni d’une relation d’ordre total, que 
nous noterons « «s » ou « < », sans rien préjuger de la 


Les concepts mathématiques sont des objets 
abstraits sur lesquels on ne peut que raisonner. 
Toutefois il est possible de donner une illustration 
naïve de certains d’entre eux. Ainsi, au triangle 
abstrait du géomètre, on peut faire correspondre 
l’image expérimentale de la forme triangulaire d’un 
morceau de papier, par exemple, ou d’un triangle 
dessiné. De même, la notion de majorant d’un 
ensemble ordonné peut être illustrée — avec toutes 
les réserves d’usage — par le document ci-des¬ 
sous : la hauteur 3,25 m est un majorant pour 
l’ensemble des hauteurs de véhicules autorisés à 
circuler sous ce tunnel. 
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ENSEMBLES ORDONNÉS, BORNES 

nature des éléments composant cet ensemble (qui 
peuvent être des nombres, mais aussi les points d’une 
droite, les droites d’un plan, les éléments phonologi¬ 
ques d’une langue, etc.). Nous allons considérer une 
partie de l’ensemble E dont les éléments x sont 
ordonnés entre deux éléments a et b ; on l’appelle un 
intervalle dans E. Les différents cas possibles sont 


Les nombres réels forment un ensemble ouvert, 
illimité dans les deux sens ; si a et b sont deux 
nombres réels, tels que a soit plus petit que b, et si x 
est lui-même un nombre réel, les définitions ci-dessus 
peuvent être illustrées facilement, en donnant aux 
relations « ^ » et « < » leur signification usuelle 
(« inférieur ou égal à » et « strictement inférieur à »). Si 
E est l’ensemble des points d’une droite (E), si a et b 
désignent deux points déterminés de cette droite, a 
étant à gauche de b, et si x est un point quelconque 
situé entre a et b, on a une image des intervalles 
désignés dans le tableau ci-dessus en donnant à « » 

le sens « à gauche de ou confondu avec » et à « < » 
celui de « strictement à gauche de ». Graphiquement, 
on a les cas indiqués sur la figure ci-dessous. 



La partie en grisé de la droite est exclue de l’inter¬ 
valle considéré ; a et b ont été entourés d’un cercle 
quand ils ne font pas partie de l’intervalle (relation 
« < ») ; la partie de la droite qui n’est pas en grisé et, 
éventuellement, les points a et/ou b constituent 
l’intervalle considéré. 


• Majorant et minorant d’un ensemble. Soit un 

ensemble E muni d’une relation d’ordre total, repré¬ 
sentée par « » ; si entre deux éléments x et y de E on 

a la relation x ^ y, y est appelé un majorant pour x et, 
en renversant l’ordre, x est dit minorant pour y. 

Si X est une partie de E telle que pour tout x E X on 
ait x ^ y, on dit que y est un majorant de X. Si 
l’ensemble de tous les majorants de X comprend un 
élément p plus petit que tous les autres, on démontre 
en théorie des ensembles que cet élément p est unique 
et on l’appelle la borne supérieure de X. En renversant 
l’ordre, on définit de la même façon un minorant pour 
X et la borne inférieure de X. 

• Exemples. 

1 - Soit l’ensemble t^J des entiers naturels et du 

zéro : 

N = {0,1,2,3,...}, 

et un sous-ensemble X de N défini par « les multiples 
de 2 inférieurs ou égaux à 10», soit: 


X = { 2,4, 6, 8,10}. Un nombre tel que 11 (extérieur à 
l’ensemble X) est un majorant pour X, puisque pour 
tout x appartenant à X on a évidemment x < 11 ; il y a 
ainsi une infinité de majorants pour X, qui sont les 
entiers supérieurs ou égaux à 11. Considérant l’entier 
10 : pour tout x appartenant à X on peut écrire x 10 ; 
10 est donc aussi un majorant pour X. Mais 10 est 
inférieur à 11, et à tous les autres majorants de X, 
comme 12, 13, ... : 10, plus petit que tous les autres 
majorants de X, est la borne supérieure de X (cette 
borne est contenue dans X). De même on montre 
aisément que 2 est la borne inférieure de X. 

2 - Soit l’ensemble Q des nombres rationnels 
(entiers ou fractionnaires, positifs ou négatifs) ; consi¬ 
dérons le sous-ensemble X ayant pour éléments les 
nombres de la forme x — 1 — k, k étant un nombre 
rationnel positif (par exemple: x=1-1/2 = 1/2; 
x = 1-1=0; x = 1-5/3 = 2/3; ...). Tous les élé¬ 
ments de X sont inférieurs à 1 (puisque x est égal à « 1 
moins un nombre positif »), donc 1 est un majorant 
pour X ; de même, tout nombre rationnel supérieur à 1 
est aussi un majorant pour X. D’autre part, tout ration¬ 
nel inférieur à 1 appartient à X (puisque 1 - k peut 
prendre toute valeur rationnelle donnée inférieure à 
1 ) ; donc 1, qui est le plus petit des majorants de X, est 
la borne supérieure de cet ensemble, qui, selon la 
terminologie indiquée plus haut, est ouvert à droite et 
illimité à gauche : 

X = ]<—, 1[ (avec x rationnel). 

3 - Considérons, dans Q' (ensemble des ration¬ 
nels positifs), les nombres x tels que leur carré soit 
inférieur à 2 ; écrivons quelques-uns des éléments de 
cet ensemble, sous leur forme décimale : 


x 

0... 0,5... 

0,7... 1 ... 

1,1 ... 

1,4 .. 

X 2 

0... 0,25... 

0,49... 1 ... 

1,21 ... 

1,96 

X 

1,41 ... 

1,415... 



X 2 

1,988 1 ... 

2,002 225 ... 




On voit que 1,415 est un majorant pour X, puisque son 
carré est supérieur à 2, et qu’il en est ainsi de tout 
nombre rationnel supérieur à 1,415; mais il existe 
aussi des nombres inférieurs à 1,415 dont le carré soit 
inférieur à 2, et l’on sait qu’il n’en existe aucun dont le 
carré soit égal à 2. L’ensemble X, partie de admet 
bien une infinité de majorants, mais il n’admet pas de 
borne supérieure (par contre, si l’on avait étudié X 
dans l’ensemble des réels positifs, qui comprend les 
irrationnels, on aurait pu écrire qu’il admet V2 pour 
borne supérieure). 

Remarque sur ces exemples : il est commode d’illus¬ 
trer la notion de majorant ou de borne supérieure 
(respectivement : de minorant ou de borne inférieure) à 
l’aide d’exemples tirés de la théorie des nombres, 
c’est-à-dire de l’arithmétique ; mais le lecteur ne doit 
pas perdre de vue cette idée que la théorie des 
ensembles, telle qu’on l’expose de nos jours, n’est pas 
bâtie sur la théorie des nombres ou en vue de la 
justifier : elle peut être édifiée axiomatiquement, sans 
tenir compte de la nature des éléments des ensembles, 
et, à partir des résultats qu’elle fournit, on peut définir 
en particulier les ensembles des nombres arithméti¬ 
ques et leurs propriétés. 

Le théorème de Zermelo. 

(Ne pas confondre avec Vaxiome de Zermelo.) 

Soit X une partie d’un ensemble E sur lequel on a 
défini une relation d’ordre total. Si, pour tout x 
appartenant à X, il existe un élément a de X tel que 
a «s x, on dit que c’est le plus petit élément de X. On 
définit d’une façon analogue le plus grand élément de 
X. On montre que tout ensemble fini non vide contenu 
dans E possède un plus petit et un plus grand élément. 

Étant donné maintenant un ensemble ordonné dans 
lequel toute partie non vide admet un plus petit 
élément : un tel ensemble est dit bien ordonné : c’est le 
cas de l’ensemble N des entiers positifs, sur lequel 
nous allons nous étendre un peu. Cet ensemble est 
fermé à gauche et illimité à droite, autrement dit, il 
possède un premier terme, mais il n’a pas de dernier 
terme : 

N = {0,1,2,3,4,...}; 

une partie quelconque de N comprend toujours un 
plus petit élément, mais elle ne possède pas nécessai¬ 
rement un plus grand élément. Par exemple le sous- 
ensemble X = {3 et ses multiples} admet comme 
plus petit élément le nombre 3, mais il est illimité, car il 
n’existe pas de nombre qui soit le plus grand multiple 
de 3; par contre, le sous-ensemble X'={3 et ses 
multiples inférieurs à 100} admet un plus petit élément 
(3) et un plus grand élément (99). D’une manière 
générale : pour qu’une partie de I^J ait un plus grand 
élément, il faut et il suffit qu’elle soit finie et non vide. 


décrits dans le tableau ci-dessous : 


neianon 

entre 
a, b et x 

Caractère de l’intervalle 
considéré 

Notation 

a «s x ^ b 

Intervalle fermé d’origine a et 
d’extrémité b. 

[a, b] 

a ^ x<b 

Intervalle semi-ouvert à droite 
d’origine a et d’extrémité b. 

[a, b[ 

a < x ss fc> 

Intervalle semi-ouvert à gau¬ 
che d’origine a et d’extrémité 

b 

la, b] 

a < x < b 

Intervalle ouvert d’origine a et 
d’extrémité b. 

la, b[ 

a 

Intervalle fermé illimité à gau¬ 
che ■, d’extrémité a. 

]<-, al 

x < 

' a 

Intervalle ouvert illimité à gau¬ 
che, d’extrémité a. 

]«-. a[ 

a ^ x 

Intervalle fermé illimité à 
droite, d’origine a. 

[a, h; 

a < 

x. 

Intervalle ouvert illimité à 
droite, d’origine a. 

la, -*[ 

E 

Intervalle ouvert illimité dans 
les deux sens. 

i-, -r 



Le mathématicien allemand Ernst Zermelo (1871- 
1953). Son fameux axiome de choix (1904) a ali¬ 
menté une importante controverse entre les mathé¬ 
maticiens. 


On démontre enfin que, sur tout ensemble, il existe 
une structure d’ensemble bien ordonné : ce résultat 
important constitue le théorème de Zermelo. 


Puissance d'un ensemble. 

Ensembles équipotents. 

• Définition. Pour comparer le nombre d’élé¬ 
ments d’un ensemble fini A au nombre d’éléments d’un 
autre ensemble fini B, il existe une manière très simple 
de procéder, c’est de les compter. Nous dirons alors 
que A et E ont même puissance ou encore qu’ils sont 
équipotents s’ils contiennent le même nombre d’élé¬ 
ments. Ce nombre d’éléments s’appelle d’ailleurs, au 
sens large, le cardinal de l’ensemble considéré. Toute¬ 
fois cette définition n’est pas applicable aux ensembles 
infinis, et il est bon de définir autrement l’équipotence 
de deux ensembles, sans passer par le comptage des 
éléments d’un ensemble. Considérons par exemple 
deux ensembles A et B, A étant un ensemble d’hom¬ 
mes et B un ensemble de femmes. Pour comparer la 
puissance de deux ensembles, on peut inviter les 
hommes et les femmes à se réunir par couples mixtes : 
on pourra ainsi constater, sans calcul, si A est équipo- 
tent à B. 

Lorsqu’à tout élément a, d’un ensemble A on fait 
correspondre un élément b, d’un ensemble B, de sorte 
que tout élément de B correspond à un, et à un 
seulement, élément de l’ensemble A, on dit qu’il y a 
correspondance biunivoque entre les deux ensembles, 
et ceux-ci sont dits équipotents. 

Soit par exemple l’ensemble des entiers naturels 
(sans le zéro), que l’on désigne habituellement par le 
symbole M* (lire «N étoile»). Nous écrirons 
N* = {1,2, 3,...} et considérons l’ensemble des entiers 
négatifs {-1,-2,- 3,...}. A tout nombre a du premier 
ensemble, on peut faire correspondre le nombre - a du 
deuxième ensemble, et cette correspondance est bi¬ 
univoque : les deux ensembles sont donc équipotents : 

1 2 3 . . . . a . . . 

-1-2 -3. ...-a... 

• Propriétés de la relation d’équipotence. Soit A 
et B deux ensembles équipotents, relation que nous 
écrirons i A, B\. 

— Il est aisé de montrer que % q lA, B \ est une 
relation réflexive, symétrique et transitive, donc qu’il 
s’agit d’une relation d’équivalence. 

— Si A et S sont équipotents, alors les ensem- 
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blés des parties correspondants S J*(A) et S $(B) sont 
équipotents, ce qui s’écrit 

* q M, (1) 

— Si A et S sont deux parties d’un ensemble E, 
la relation % q lA,B\ est une relation d’équivalence 
dans l’ensembTe des'parties S $(E) ; la classe d’équiva¬ 
lence selon cette relation à laquelle appartient A 
s’appelle puissance de A (l’identification courante 
« puissance de A = cardinal de A » est un abus de 
langage toléré). 

Ensembles dénombrables. 

• Définition. L’ensemble des entiers naturels N* 
est infini : il est impossible de dire « il y a tant de 
nombres entiers ». Cet ensemble a des propriétés très 
remarquables, qui seront étudiées en temps utile ; 
nous allons nous en servir pour mesurer la puissance 
d’un ensemble quelconque à l’aide de la définition 
suivante : un ensemble est dit dénombrable s’il est 
équipotent à N*, c’est-à-dire, d’après les remarques du 
paragraphe précédent, si l’on peut apparier chacun de 
ses éléments avec un nombre entier, dans une corres¬ 
pondance biunivoque. 

• Exemples. 

— A chaque entier a on peut apparier un nom¬ 
bre 3 a et construire ainsi l’ensemble des multiples de 
3. Il est clair que la correspondance entre cet ensemble 
et l’ensemble est biunivoque : l’ensemble des multi¬ 
ples de 3 est donc dénombrable (on peut faire la même 
remarque pour les multiples de 2, les multiples de 5, 
etc.) : 

IM* = 1 2 3 ... . a ... . 

multiples de 3 = 369.. ..3a.... 

— L’ensemble des entiers relatifs ( sans le zéro), 
communément désigné par le symbole Z*, comprend 
les entiers positifs et les entiers négatifs. Écrivons cet 
ensemble en l’appariant à l’ensemble M* selon la règle 
suivante : chaque entier positif est apparié à un nom¬ 
bre impair dans M* et chaque entier négatif à un 
nombre pair. 

N* {1 2 3 4 5 6 .... 

Z*{1 -1 2 -2 3 -3.... 

Il est clair, là aussi, que la correspondance est 
biunivoque : donc l’ensemble Z* est dénombrable. 

— On peut aussi démontrer les théorèmes sui¬ 
vants, qui complètent nos considérations sur les 
ensembles dénombrables. 

1 - Tout sous-ensemble infini B d’un ensemble 
dénombrable A est lui-même dénombrable. 

2 - La réunion d’une famille finie d’ensembles 
dénombrables est un ensemble dénombrable. 

3 - La réunion d’une famille infinie dénombrable 
d’ensembles dénombrables est un ensemble dénom¬ 
brable. 

4 - L’ensemble des rationnels a/b, a et b étant 
des entiers, est dénombrable. 

• L’aleph zéro. Convenons de désigner par le 
symbole « S 0 » (lire « aleph zéro» ; aleph est la pre¬ 
mière lettre de l’alphabet hébraïque) la puissance de 
l’ensemble N*. Ce symbole est appelé premier nombre 
transfini cardinal. La puissance de tout ensemble 
dénombrable est donc mesurée par le nombre 
transfini S 0 . 

Puissance du continu. 

• Paradoxe de Galilée. Considérons deux 
fragments de ligne droite : un segment « court » et un 
segment « long » (voir figure ci-après), et mettons en 
correspondance biunivoque les points de la « ligne 
longue » avec ceux de la « ligne courte ». Il est clair 
que chaque point m de celle-ci a son correspondant 
m' sur celle-là et réciproquement : les deux ensembles 
de points [a, b J et [a', b '] ont la même puis¬ 
sance : il n’y a pas « plus » de points sur la ligne longue 
que sur la ligne courte. Ce paradoxe a été résolu pour 
la première fois par Dedekind, en 1872 : une ligne 
droite, dit-il, est plus riche en points individuels que ne 
l’est l’ensemble des nombres algébriques en nombres 
distincts. En d’autres termes : l/ensemble des points 
d’une ligne droite et l’ensemble des nombres réels sont 
équipotents. Ainsi le terme « réel » est justifié, il témoi¬ 
gne de la correspondance entre l’ensemble numérique 
considéré et un ensemble géométrique. Ainsi s’expli¬ 
que aussi que l’on désigne la puissance de l’ensemble 
des nombres réels par l’expression « puissance du 
continu ». 


ENSEMBLES DÉNOMBRABLES ET NOMBRES TRANSFINIS 



Paradoxe de Galilée. 

Il y a « autant » de points sur le segment [a, b] que sur 
le segment [a', b']. 


• Théorème de Cantor. Considérons l’ensemble 
R de tous les nombres réels : ces nombres seront 
définis plus loin (voir p. 53), mais tous les collégiens 
savent les manipuler. Ils comprennent les nombres 
rationnels (entiers ou fractionnaires, positifs ou 
négatifs), les nombres irrationnels (comme V2, V3,... 
et les nombres dits transcendants , comme tt ou e, base 
des logarithmes népériens). L’ensemble des réels est 
parfois appelé droite numérique , et chaque nombre 
réel est alors appelé un point sur cette droite. Cantor a 
démontré, en 1874, l’important théorème suivant: 

L’ensemble des points de l’intervalle 0 x 1 est 
non dénombrable. 

• Portée du théorème de Cantor. Les nombres 

rationnels de l’intervalle 0^ x«s 1, c’est-à-dire le nom¬ 
bre 0, l’entier 1 et l’infinité de nombres fractionnaires 
compris entre 0 et 1, sont un sous-ensemble de 
l’ensemble des rationnels. Or nous avons dit (ci-des¬ 
sus, § C, b, théorème n° 4) que l’ensemble des ration¬ 
nels était dénombrable : il en résulte (d’après b, théo¬ 
rème n°1) que le sous-ensemble de rationnels 
0 1 est dénombrable. 

Par conséquent les nombres de l’intervalle 0^x=ë1 
peuvent être rangés en deux sous-ensembles, une fois 
démontré le théorème de Cantor : 

— les rationnels, qui forment un sous-ensemble 
dénombrable ; 

— un deuxième sous-ensemble, non dénombra¬ 
ble, que l’on appelle le sous-ensemble deô irrationnels 
(si les irrationnels étaient dénombrables, l’ensemble 
O^x^l serait dénombrable puisque composé de 
deux sous-ensembles dénombrables, ce qui serait en 
contradiction avec le résultat du théorème de Cantor). 

Ajoutons qu’on peut répartir les irrationnels 
eux-mêmes en deux sous-ensembles : 

1 - les irrationnels algébriques, qui sont les 
racines d’équations du n-ième degré à coefficients 
rationnels, et qui forment un ensemble dénombrable 
(selon un théorème que nous n’avons pas énoncé, 
mais que nous pouvons admettre ici) ; 

2 - les irrationnels non algébriques, qui forment 
un ensemble non dénombrable et qu’on nomme nom¬ 
bres transcendants (en d’autres termes, le caractère 
non dénombrable des nombres réels provient de l’exis¬ 
tence de nombres transcendants, puisque toutes les 
autres espèces de réels sont dénombrables). 

• La puissance du continu. La puissance de 
l’ensemble des points de l’intervalle 0 x 1 est 
appelée puissance du continu. L’examen du paradoxe 
de Galilée nous fait comprendre que l’ensemble des 
réels x tel 0 «s x 1 est équipotent à l’ensemble IR de 
tous les réels, c’est-à-dire des réels tels que 
— oo < x < + oo (la droite numérique), qui possède donc, 
lui aussi, la puissance du continu. 

Nous avions appelé X 0 la puissance de N*, l’aleph de 
l’ensemble (R est donc différent de S 0 et nous devons 
écrire : 

S de R > S 0 . 


• Deux questions se posent alors : 

1 - Y a-t-il d’autres alephs que l’aleph zéro et 
l’aleph du continu ? 

2 - Y a-t-il des alephs entre aleph zéro et l’aleph 
du continu ? 

Ces questions, dont le traitement est indispensable si 
l’on veut faire progresser l’analyse et l’algèbre, sont 
loin d’avoir reçu à l’heure actuelle des réponses satis¬ 
faisantes. 

Le transfini ordinal. 

Considérons le problème suivant, qui fait songer aux 
problèmes de « trains qui se rencontrent » et de 
« bassins qui se vident » de l’arithmétique élémentaire. 

Un piéton se dirige de A vers B (AB = 1 000 mètres) 
à la vitesse de 1 m/s (3,6 km/h). En même temps que 
lui un cycliste part de A ; il se déplace à la vitesse 
uniforme de 3 m/s (10,8 km/h). Lorsque le cycliste 
arrive en B, il fait un demi-tour instantané et se dirige 
vers A ; il rencontre le piéton en A', fait alors un 
nouveau demi-tour instantané, se dirige vers B, atteint 
B, retourne vers le piéton, qu’il rencontre en A", et 
ainsi de suite jusqu’à ce que le piéton soit arrivé en B. 
On demande le chemin parcouru par le cycliste (bien 
entendu, pour raisonner dans l’abstrait, on considère 
que le piéton et le cycliste sont réduits à n’être que des 
points, que les « demi-tours » se font sans perdre la 
moindre fraction de seconde, etc.). 


A A' A" A" 1 B 

L, ■ I _ 1 _ | _ i _ i 

A"" 


Le transfini. 


Étudions en détail les premières étapes de ces 
déplacements. 

— 1 re rencontre. Le cycliste va trois fois plus vite 
que le piéton ; comme ils partent en même temps de A, 
le cycliste arrive en B avant le piéton, fait demi-tour et 
rencontre son compagnon en A'. Appelons t le temps 
nécessaire pour accomplir ces déplacements, à savoir 
ABA' pour le cycliste, AA' pour le piéton. Si l’on pose 
AA' = x, le trajet (AB + BA') représente 3 x (puisque le 
cycliste a une vitesse trois fois supérieure à celle du 
piéton) ; les deux trajets réunis : 

AA' + (AB + B A') 

représentent deux fois la distance AB. On a donc 

2 AB = x + 3x = 4x, (2) 

d’où 

x = = 500 m ; (3) 

le cycliste a donc parcouru, dans cette première étape, 
1 500 m. 

— 2 e rencontre. Le piéton et le cycliste sont en 
A', le cycliste va vers B, revient et rencontre le piéton 
en A". Le problème est le même que précédemment, 
mais pour un trajet A' B = 500 m, moitié du trajet AB. 
D’où les réponses : 

— trajet du piéton : 250 m ; 

— trajet du cycliste : 750 m ; 

— 3 e , 4 e , ..., n-ième rencontres. Le problème se 
répète toujours dans les mêmes termes ; à chaque 
étape, le piéton et le cycliste accomplissent un trajet 
qui est égal à la moitié du précédent. On peut donc 
établir le double tableau de marche ci-dessous (en 
reprenant depuis le départ et en appelant a la distance 
AB) : 


Tableau de marche du piéton et du cycliste. 


Étapes 

I e (A ') 

2 e (A ") 

3 e (A'") 

100 e (A (100) ) 

n e (A (n> ) 

Chemin parcouru par 
le piéton 

(en mètres) 

500 = a x ^ 

250 = a x ^5 

125 — a x 

1 

a x 

1 

3 X 2 n 

Chemin parcouru par 
le cycliste 

(en mètres) 

1 500 = 3 a x i 

750 = 3 a x ^5 

375 = 3 a x^g 

3 a x 

3a x^- 
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En principe, nous pouvons prolonger ce tableau 
indéfiniment et nous aurons : 

Chemin parcouru par le piéton : 

AB X (2 + 2 5 + 2 3+ -^2 7rH -) = 1 O 00 m î ( 4 ) 

chemin parcouru par le cycliste : 

3/AB x(- ++ - + 2 "~ { -) = 3000m (5) 

Les termes de la somme entre parenthèses forment un 
ensemble infini dénombrable, puisque l’exposant n 
prend toutes les valeurs possibles de N* = {1,2, 3 ... } ; 
on dit qu’ils forment une série. Cependant, nous 
savons que le piéton arrivera en B, c’est-à-dire qu’il 
aura parcouru 1 000 m, et que le cycliste, dans le même 
temps , aura parcouru 3 000 m, puisqu’il se déplace 
trois fois plus vite. La série 


prend, à la limite (notion sur laquelle nous revien¬ 
drons), la valeur 1 (on dit que c’est une série conver¬ 
gente). 

• Numérotation des instants. Chaque terme de 
la série correspond à un instant dans la vie du cycliste. 
A l’instant 0 il était en A, à l’instant 1 en A', à l’instant 2 
en A", et ainsi de suite, sans qu’on puisse jamais 
s’arrêter. Mais, pourtant, le cycliste et le piéton finis¬ 
sent par se rencontrer en B : c’est une évidence ; quel 
« numéro » faut-il donner à l’instant de cette rencontre 
finale ? Si l’on utilise un nombre x de l’ensemble N des 
entiers naturels, on pourra toujours évoquer l’exis¬ 
tence d’un instant (x + 1) qui sera postérieur à x, et 
ainsi de suite. 

Pour nommer l’instant « final », il faut utiliser un 
« nombre entier » qui soit supérieur à tous les entiers 
successifs ; un tel nombre ne peut être que fictif, bien 
entendu, et il est impossible de l’écrire avec les signes 
numériques habituels. Cantor a noté ce « nombre » à 
l’aide de la lettre grecque oméga : « o) ». Ce nombre w : 

1 - est ordinal : il désigne le rang d’un instant 
(le piéton et le cycliste se rencontrent au a> e instant) ; 

2 - est supérieur à tout nombre ordinal apparte¬ 
nant à N (cela signifie qu’il désigne un instant ultérieur 
à tous les instants numérotés à l’aide de l\J) ; 

3 - est le premier de son espèce, car, s’il existait 
un « nombre a> » avant a), ce nombre désignerait, 
précisément, l’instant final. 

On traduit ces trois remarques en disant que co est le 
premier nombre transfini ordinal : « premier » traduit 
la propriété (3), « nombre ordinal » la propriété (1), 
transfini la propriété (2). 

Résumons-nous : le premier nombre transfini ordi¬ 
nal, co, est le rang de l’instant où le piéton et le cycliste 
se rencontrent en B. On peut ainsi dire — ce qui étend 
considérablement l’intérêt d’une notion telle que co — : 
le premier nombre transfini ordinal est le rang du 
terme pour lequel une série convergente atteint sa 
limite. 

Ce premier nombre transfini ordinal représente un 
soulagement pour l’esprit du mathématicien : « quand 
on fait la somme des termes d’une série convergente, 
on convient d’appeler w-ième le terme — qui ne sera 
jamais écrit — celui pour lequel cette somme prend sa 
valeur limite. 

Fonctions et graphes. 

Notion générale de fonction. 

• Remarques historiques. L’origine de l’idée 
classique de fonction apparaît chez Descartes, le créa¬ 
teur de la géométrie analytique : l’ordonnée y d’un 
point M d’une courbe C dépend de l’abscisse x de ce 
point. C’est Leibniz qui introduisit le mot « fonction » 
et Jean Bernoulli définit, en 1718, les fonctions d’une 
variable comme des : 

« quantités composées de quelque manière que ce soit 

de cette grandeur variable et de constantes ». 

Euler introduit la notation : 

y=f(x) (1) 

(lire « y = f de x »), pour écrire que la grandeur y est 
fonction de la variable x. 

Dès 1748, Euler étudie et classe systématiquement 
les fonctions élémentaires 

y= ax+ b, y = ax 2 + bx+ c, etc. ; 

l’année suivante il généralise la notion de fonction : la 
relation y = f{x) entre l’ordonnée y et la variable xd’un 
point M appartenant à une courbe quelconque est une 
fonction. 



L’ordonnée y dépend de x : c’est une fonction de x. 


Dans la seconde moitié du XVIII e siècle, l’étude des 
propriétés des fonctions repose soit sur la théorie des 
limites (D’Alembert, 1767), théorie féconde mais qui 
manque alors de rigueur, soit sur des méthodes algé¬ 
briques, comme le fit Lagrange (1797-1799), qui 
emploie notamment les développements en série de 
Taylor. Cependant il faut attendre les travaux de Cau¬ 
chy (1821), Lobaôevskij (1834) et Dirichlet (1837) 
pour parvenir à une définition générale classique de la 
notion de fonction : c’est une « quantité » (Cauchy 
prend ce terme au sens de « nombre réel ») dont la 
valeur dépend d’une ou plusieurs autres quantités, 
appelées variables indépendantes. 

Nous allons voir que la théorie des ensembles per¬ 
met une définition beaucoup plus générale de la notion 
de fonction, grâce au concept d 'application d’un 
ensemble dans un autre. C’est Dedekind qui a souligné 
l’importance fondamentale de ce concept dans son 
livre célèbre Que sont et que doivent être les nom¬ 
bres ?, paru en 1888 ; la définition même d’une appli¬ 
cation est due à Dirichlet. 

• Application d’un ensemble E dans un ensem¬ 
ble F. Soit un ensemble E, constitué d’éléments x et 
un ensemble F constitué d’éléments y. Supposons 
que nous convenions d’une règle permettant de faire 
correspondre à tout élément x E E un élément y E F 
et un seul : on dit qu’on a défini une application de 
l’ensemble E dans l’ensemble F. On appelle : 

— fonction : l’opération qui associe un élément 
xE E à un élément yE F selon la règle convenue ; 
cette opération est souvent désignée par le symbole f ; 

— ensemble de départ ou encore domaine de 
définition : l’ensemble E ; 

— variable indépendante ou argument : les élé¬ 
ments x de l’ensemble E ; 

— ensemble d’arrivée ou domaine des valeurs : 
l’ensemble F ; 

— valeur de la fonction : pour l’élément x E E 
l’élément y E F qui lui correspond ; on dit souvent que 
x est V antécédent et y V image dans F de cet antécé¬ 
dent. 

Pour noter symboliquement la phrase « Soit f une 
application de E dans F», on peut utiliser l’une des 
trois formulations suivantes : 

x^> y (lire : « x s’applique sur y ») ; 
y = f(x) (lire : « y égale f(x) ») ; 
soit f : E —> F une application. 

• Exemples : 

— Soit E un ensemble de stations de chemin de 
fer : E = { a, b, c, ..., k } et F un ensemble de nombres 
servant à mesurer le temps : 

F={8 h, 8 h 01 mn, ..., 23 h} par exemple. 

L’opération f qui associe aux éléments de E des 
éléments de F tient compte des distances entre les 
stations et de la vitesse du train. Le résultat de 
l’application E—^ F est une table d’indicateur de 
chemin de fer. 

— Soit E une figure géométrique, c’est-à-dire 
un ensemble de points A4, et soit T une transformation 
de cette figure, c’est-à-dire une construction qui fait 
correspondre à tout point A4 E E un point A4' selon une 
règle déterminée. L’ensemble des points A4' constitue 
une figure F, et la transformation Test une application 
de E dans F, ce qui s’écrit : 

E —-■—► F ou M’ = T(M). 

— En analyse, branche des mathématiques que 
nous présentons p. 102, on étudie les applications 
dans lesquelles les ensembles E et F sont des ensem¬ 
bles de nombres (entiers, rationnels, réels, complexes, 
etc.). Les fonctions correspondantes sont appelées 


fonctions numériques (on précise : fonction d’une 
variable réelle, d’une variable complexe, etc. selon la 
nature de l’ensemble de départ). Nous verrons qu’il 
existe des ensembles, appelés espaces vectoriels, dont 
les éléments sont des vecteurs : si l’ensemble de 
départ E est un espace vectoriel, la fonction est dite 
fonction vectorielle. 


Caractères d'une application. 

• Application surjective. Soit f une application 
de E dans F, E et F étant des ensembles donnés, 
distincts ou non ; à tout x E E on peut associer un 
élément y = f(x) appartenant à F. Si l’on peut, à tout 
y E F, associer un élément xtel que y = f(x), l’applica¬ 
tion de E dans F est dite surjective, ce que l’on précise 
en disant : f est une application de E sur F (et non pas, 
comme dans le cas général, de E dans F). Prenons un 
exemple simple pour illustrer cette définition. Soit les 
deux ensembles E et F utilisés au paragraphe a) pour 
introduire la définition de l’application : la figure qui 
les représente montre qu’il existe des éléments de F 
qui n’ont aucun antécédent dans E, c’est-à-dire que 
l’application n’est pas surjective. Par contre, si nous 
considérons les deux ensembles : 

— N* : ensemble des entiers naturels, 1, 2, 
3, ... n, (n ■+• 1 ) ..., 

— F : ensemble des carrés parfaits, 1,4, 9 ... n 2 , 
(n +1) 2 ..., 

et l’application qui fait correspondre à tout entier n du 
premier ensemble son carré n 2 , appartenant au deu¬ 
xième ensemble, il est clair qu’à tout élément y de F 
correspond un élément x de M* tel que le carré de x 
soit y : l’application considérée est donc surjective. 

Donnons une autre expression de l’application sur¬ 
jective. Soit f une application de E dans F et E 1 une 
partie quelconque de E. Dans l’application f, à tous les 
éléments de E 1 on associe des éléments de F dont 
l’ensemble constitue une partie de F appelée image de 
E ! par f ; on écrit parfois cette image sous la forme 
f(E. ,). De même f(E) représente l’ensemble des images 
de tous les éléments de E ; si on a f(E) = F, f est une 
surjection. 

Lorsqu’une application est surjective, on dit parfois 
qu’elle transforme E en F, ou x en f(x). Ainsi, dans 
l’exemple d’une translation (voir ci-dessus, b), chaque 
point A4' de la figure F correspond à un point A4 de la 
figure E tel que A4 soit relié à A4' par la relation 
A4' = T{M) ; la translation est une application surjec¬ 
tive, et l’on peut dire que A4 est transformé en A4', ou 
que E est transformé en F. 

De même, l’application de U dans U qui fait corres¬ 
pondre à tout nombre réel x un autre nombre réel 
y = 3x + 5 est surjective, car, étant donné une valeur 
quelconque de y, on peut toujours trouver une valeur 
de x telle que la relation précédente soit vérifiée, x 
appartenant à R (pour trouver une telle valeur, il faut 
résoudre l’équation 3 x + 5 = y, après avoir donné à y 
la valeur choisie). 

• Application réciproque. Soit f une application 
de E dans F. Considérons une partie F, de F ; on 
appelle image réciproque de F A par f le sous-ensemble 
de tous les éléments x appartenant à E tels que 
f(x) E F 1 ; on note ce sous-ensemble f~\F^), le sym¬ 
bole (- 1) en exposant désignant donc une opération 
réciproque. 



La fonction f applique E dans F et l’on se donne une 
partie F t de F : la partie de l’ensemble E qui est en 
bleu sur la figure représente le sous-ensemble de E 
dont les éléments sont appliqués dans F, (= ont leur 
image dans FJ. Ce sous-ensemble est /'image réci¬ 
proque de F, par f ; on la représente par T 1 (FJ. 


Voici un exemple géométrique. La figure ci-après 
représente l’application suivante : 

— ensemble E de départ : tous les points du 
plan de la figure. 
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■g 

— ensemble F d’arrivée : tous les points de la 5 

droite (F) ; ^ 

— fonction f (règle appliquant E dans F) : à tout | 

point M de E on fait correspondre le point m de (F), * 
pied de la perpendiculaire abaissée de M sur (F). 1 

Sans être grand géomètre, le lecteur constatera ^ 
aisément que tout point M du plan de la figure possède 
une image m sur (F), puisqu’on peut toujours mener 
d’un point une perpendiculaire à une droite. Considé¬ 
rons maintenant le point a sur la droite (F) : c’est une 
partie de l’ensemble F, qu’on peut désigner par F 1t ce 
qui permet d’écrire : F 1 = { a}. L'image réciproque de 
F! est représentée par l’ensemble de tous les points de 
E qui se projettent en a, c’est-à-dire par tous les points 
de la droite (D), puisque aussi bien A, que B, C,... sont 
sur une même perpendiculaire à (F). Ainsi donc à un 
élément de F correspondent une infinité d’éléments 
réciproques dans E. 

• Application injective. Une application est dite 
injective lorsque deux éléments de E, distincts, ont 
pour images deux éléments distincts de F. Il résulte de 
cette définition qu’un élément de F ne saurait avoir 
plus d’un antécédent dans E, et que son image récipro¬ 
que est donc, soit un ensemble vide, soit un ensemble 
singulier. L’exemple donné au début du paragraphe a) 
est celui d’une application injective : on constate, en 
examinant la figure qui l’accompagne, que chaque 
élément de F possède zéro ou un antécédent dans E. 
La translation géométrique, donnée en exemple au 



Cette œuvre de Salvador Dali (1931) intitulée Six apparitions de Lénine sur un piano, est un exemple naïf d’une 
application de l’ensemble E (les six têtes de Lénine) dans l’ensemble F (les touches du piano). Le lecteur 
constatera que cette application n’est pas à la fois injective et surjective, donc qu’elle n’est pas bijective. 


paragraphe b), est aussi une injection, puisque à 
chaque point de F correspond un antécédent dans E, 
et un antécédent seulement (elle était, en outre, surjec¬ 
tive). 

• Application bijective. Une application qui est à 
la fois injective et surjective est appelée bijective. Soit f 
une application de E dans F; si, pour tout y e F il 
existe un x G E et un seul tel que y= f(x), l’applica¬ 
tion f est bijective. 

Ainsi donc, si deux ensembles E et F se correspon¬ 
dent par une application bijective : 

— à tout élément de F correspond un seul 
antécédent dans E ; 

— à tout élément de E correspond une seule 
image dans F. 

Nous avons illustré les caractères surjectif, injectif et 
bijectif d’une application sur la figure ci-dessous. 


• Remarque. Étant donné une application bijec¬ 
tive f de E dans F, tout élément de F admet un 
antécédent et un seul dans E, ce qui définit une 
application de F dans E, qui est aussi une bijection : on 
l’appelle la bijection réciproque de f. On dit que les 
deux ensembles E et F sont mis en correspondance 
biunivoque par ces deux applications, notées f et f~\ 
ou encore que f et f -1 réalisent entre E et F une 
correspondance biunivoque. On dit aussi que f et f~ A 
sont des fonctions inverses. En appelant x un élément 
quelconque de l’ensemble E et y un élément quelcon¬ 
que de l’ensemble F, on a les égalités équivalentes : 
y = f(x) et x= f~\y). 

Deux ensembles E et F entre lesquels il est possible 
d’établir une bijection (une correspondance biunivo¬ 
que) sont dits équipotents : nous comprendrons plus 
loin l’importance de cette propriété. 


Caractères d’une application. 

I — Application quelconque : f n’est pas injective (x, et x 3 ont même image y 2 ) ; elle n’est pas non plus surjective 

(il y a des éléments de F qui n’ont pas d’antécédent dans E). 

II — Application injective : un élément quelconque de F possède, dans l’application g, soit un seul antécédent (y, 
y 3, y 6 , y 7, y e )> soit zéro antécédent. Par contre, g n’est pas surjective, puisque certains éléments de F n’ont pas 

d’antécédent dans E. 

III — Application surjective : chaque élément de F possède, dans l’application h, un antécédent dans E ; par 
contre, h n’est pas injective, puisqu’à certains éléments de F (y 3 et y 4 par exemple) correspond plus d’un antécédent 

dans E. 

IV — Application bijective ; le lecteur vérifiera que l’application k est à la fois injective et surjective. 


Autres résultats. 

Le lecteur intimidé par les calculs abstraits peut 
éviter de lire ce qui va suivre et passer directement à la 
théorie du produit. 

Dans ce qui suit on appelle f une application d’un 
ensemble E dans un ensemble F, A et B des 
sous-ensembles arbitraires de E. On démontre les 
résultats suivants. 



N° Proposition 

17 (A C B) f(A) C f(B). 

18 A/0=>f(A)^0. 

19 f(A U B) — f(A) U f{B). 

20 f(A n B) C f(A) (1 f(B). Dans le cas d’une injec¬ 

tion, « C » est remplacé par « = ». 

21 f \A U E) = f~'(A) U f '(B). 

22 r 1 (/inB) = r 1 (^)nr , (e). 

23 r(CA) = CF 1 (A). 

24 f\0) = 0 . 

25 A ^ 0=> f \A) ^ 0 si, et seulement si, f est une 
surjection. 

26 f \F,) = f '\F , D f(E)l 

27 AC f~\f{A)\. 

28 f[f \F,)]C F,. 


• Applications composées. Soient trois ensem¬ 
bles E, F, G, f une application de E dans F, g une 
application de F dans G ; l’application de E dans G 
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PRODUIT CARTESIEN 


définie par l’écriture g\f(x)] s’appelle Vapplication 
composée de g et f (ou la fonction composée de g et 
f). On la note g°f , ou, s’il n’y a pas de confusion 
possible, gf. A une valeur x de la variable qui décrit 
l’ensemble E, on associe en G la valeur y = g[f{x)]. 
L’ordre dans lequel on compose les applications est 
essentiel et, si G est distinct de E, la notation fo g n’a 
aucun sens. Nous retrouverons la notion de fonction 
composée p. 118. 

Produit cartésien. 

• Définition. Considérons deux ensembles E et 
F, respectivement constitués d’éléments x et y ; for¬ 
mons tous les couples possibles (x, y) : l’ensemble de 
ces couples est appelé ensemble produit de E par F ou 
encore produit cartésien de E par F. On le note : E x F. 
On considère que le couple (x, y) est distinct du 
couple (y, x) et l’égalité de deux couples (x, y) et 
(x', y') est définie par les conditions x = x', y = y'. 

• Comme illustration simple de la notion 
d’ensemble produit, nous prendrons un jeu bien connu 
des écoliers : la bataille navale. On sait que ce jeu se 
joue à deux, chaque joueur disposant d’un rectangle 
quadrillé, de vaisseaux de guerre représentés symboli¬ 
quement par un ou plusieurs petits « carreaux » ; le 
rectangle quadrillé a l’aspect suivant (que nous rédui¬ 
sons pour simplifier notre exposé) : 



aa' 

ba' 

ca' 

da' 

ea' 

fa' 

ab' 

bb' 

cb’ 

db' 

eb' 

fb' 

ac' 

bc' 

cc' 

de' 

ec' 

fc' 

ad' 

bd' 

cd' 

dd' 

ed' 

fd' 

ae' 

be' 

ce' 

de’ 

ee' 

fe' 

af' 

bf 

cf 

df' 

ef 

ff' 

ag' 

bg ' 

cg' 

dg' 

eg ' 

fa' 


a 

b' 

c' 

d' 

e' 

f ' 

g' 


Quadrillage en vue d’une « bataille navale > 


Chacun des deux joueurs ignore la disposition de la 
flotte de son adversaire, et chaque joueur annonce, 
chacun à son tour, un « coup de canon » en précisant : 
« aa' » par exemple, pour désigner le carreau utilisé 
chez l’adversaire : si celui-ci a placé, en ce carreau, 
l’un de ses vaisseaux, ce bâtiment est considéré 
comme coulé. Dans l’exemple que nous avons pris, il y 
a 30 carreaux, notés aa', ab', ac', ... Appelons E 
l’ensemble des colonnes a, b, c, d, e, fet F l’ensemble 
des lignes a', b\ c', d ', e', f, g'. L’ensemble des 
carreaux, c’est-à-dire de tous les couples tels que aa’ 
est l’ensemble produit E x F. 

On voit immédiatement que l’ordre dans lequel on 
prend les lettres du couple a une importance primor¬ 
diale (« 1 ère ligne, 3 e colonne » désigne un carreau 
différent de « 3 e ligne, 1 ère colonne » : dans un cas il 
s’agit du carreau ca', et dans le second du 
carreau ac'). Pour que deux éléments de l’ensemble 
produit soient équivalents, il faut donc non seulement 
que les deux éléments qui les composent soient égaux, 
mais encore qu’ils soient pris dans le même ordre. 
C’est pourquoi le couple (a, c') n’est pas équivalent au 
couple (c, a'). 

• Un exemple moins futile. Considérons deux 
droites E et F qui se coupent en O ; la droite E est un 
ensemble de points P et la droite F un ensemble de 
points Q. Le produit cartésien E x F, formé des cou¬ 
ples (F, Q), représente les points M du plan déterminé 
par les deux droites, avec la construction suivante : on 
mène par P une parallèle à Fet par Q une parallèle à E, 
l’intersection de ces deux droites est le point M, image 
du couple (P, Q). On constate que : 

1 - chaque point M distinct correspond à un 
couple (P, Q) déterminé ; 

2 - deux points M(P, Q) et M’(P', Q') sont 
confondus si P = P' et Q = Q'. 

Le lecteur quelque peu familiarisé avec les mathéma¬ 
tiques scolaires aura reconnu dans ce qui précède un 
système de coordonnées cartésiennes (voir p. 95). 



Les points M du plan déterminé par les droites (E) 
et (F) sont les images des couples (P, Q) dont 
l’ensemble est le produit cartésien Ex F. 


Graphes. 

• Définition. Soit deux ensembles E et F et leur 
produit cartésien Ex F, composé de tous les couples 
(x, y) d’éléments x6E et y El F. Définissons par ail¬ 
leurs une relation R\x, y \ entre x et y : les couples 
(x, y) qui vérifient cette relation constituent un 
sous-ensemble de E x F qu’on appelle graphe de la 
relation R \ x, y {. 

Le terme graphe a été introduit par Sylvester, à la 
suite des travaux de Morgan et de Hamilton. Le lecteur 
doit bien prendre garde à ne pas confondre, malgré la 
similitude des termes, graphe et graphique : un graphe 
est un ensemble déterminé, partie d’un ensemble 
produit, tandis qu’un graphique est un dessin. Dans 
certains cas particuliers, un graphe peut être repré¬ 
senté par une image géométrique, ou, comme on dit, 
par une représentation graphique. 

• Graphe d’une correspondance. Deux ensem¬ 

bles E et F sont mis en correspondance lorsque à 
chaque élément x E E on fait correspondre un ou 
plusieurs éléments y E F. Considérons un ensemble E 
formé de cinq hommes nommés a, b, c, d, e et un 
ensemble F composé de cinq femmes nommées a', b', 
c', d', e' (les deux ensembles comportent 

autant d’éléments, mais ce n’est pas là une caractéristi¬ 
que nécessaire). Le produit E x F désigne l’ensemble 
des couples que l’on peut former avec ces dix person¬ 
nes. Le lecteur vérifiera sans peine qu’il en existe 25. 
Parmi ces 25 couples, qu’on peut désigner d’une façon 
générale par (x, y) avec x E E et y E F, il en est dans 
lesquels l’homme est plus âgé que la femme; cette 
relation entre x (l’homme) et y (la femme) peut s’écrire 
R l x, y\. Les coiîples pour lesquels elle est vérifiée 


Les couples (x, y) reliés par un trait vérifient la 
relation : 

R\ x,y \ = « âge de x supérieur à âge de y ». 

Ce schéma exprime que les couples suivants véri¬ 
fient la relation : 

R lx,yl = « âge de x supérieur à âge de y » : 

(a, c'), (a, e'), (b, b'), (c, a') 

(c, d'), (c, e'), (d, b'), (d, c'). 

Ces huit couples constituent le graphe de la relation 
R\x,y\; les lignes joignant les points a et c', a et e', 
etc... tracées sur le dessin sont l’image (pas très 
jolie !) de ce graphe. 


Ensemble E 

A 


a b c d e 



forment un sous-ensemble E x F, qui est le graphe de 
la relation Rlx, y\. Pour donner une image de ce 
graphe, c’est-à-dire de ce sous-ensemble, nous pou¬ 
vons procéder de plusieurs manières. En voici deux 
parmi un nombre indéfini. 

— Écrivons les deux ensembles l’un au-dessous 
de l’autre, et relions par un trait les valeurs de x et de y 
qui vérifient la relation, c’est-à-dire les noms des 
hommes aux noms des femmes qui sont leurs cadet¬ 
tes (voir figure précédente) ; 

— Traçons deux droites perpendiculaires Oxet 
Oy. Marquons sur Ox les points (arbitraires) a, b, c, d, 
e, qui sont les images des hommes de l’ensemble E, et 
sur Oy les points a', b', c', d', e', images des femmes de 
l’ensemble F. En menant par chacun de ces 
points des parallèles à Oy (pour les points de l’ensem¬ 
ble E) et à Ox (pour les points de l’ensembje F), on 
obtient un « quadrillage » dont chaque intersection est 
l’image d’un couple. On peut ensuite entourer d’un 
petit cercle de couleur, par exemple, ceux des couples 
qui vérifient la relation Rlx, y \\ cet ensemble de 
petits cercles colorés est l’image du graphe de la 
relation Rlx, yl. 
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Image de la relation R\x,y\ = « âge de x supérieur 
à âge de y ». 


• Graphe d’une application. Une application 
E —F est, on l’a vu ci-dessus, une correspondance 
telle qu’à un élément x E E il corresponde un seul 
élément y E F dans l’ensemble d’arrivée. Les couples 
(x, y) qui vérifient la relation y = f(x) constituent un 
sous-ensemble du produit cartésien E x F, c’est-à-dire 
le graphe de l’application E^-^F. 

• Graphe d’une fonction numérique. Si E et F 
sont des ensembles de nombres, l’application E —■£-> F 
est une fonction numérique, et le graphe de cette 
fonction est constitué des couples (x, y), x et y étant 
des nombres. En analyse, nous étudierons notamment 
les fonctions d’une variable réelle. Dans ce cas, E est 
l’ensemble R des nombres réels et les valeurs y = f(x) 
de la fonction sont aussi des nombres réels. Une telle 
fonction est donc une application de R dans R. Chaque 
valeur x de la variable correspond à un point ( abscisse) 
sur un axe x' x et chaque valeur y = f(x) de la fonction 
à un point (ordonnée) sur un axe y' y : le 
graphe de la fonction, c’est-à-dire l’ensemble des 
couples (x, y) qui vérifie la relation y = f(x), a pour 
image un graphique qui est la courbe représentative de 
la fonction. 

Généralisation et propositions fondamentales. 

• Application canonique. Soit, dans l’ensemble 
produit U = Ex F, le graphe des couples (x, y) et 
considérons les couples (y, x) dans l’ensemble 
U'= F x E. L’application bijective de U sur U' qui 
transforme (x, y) en (y, x) est appelée application 
canonique ; si les ensembles E et F sont identiques, 
c’est la symétrie canonique. Les éléments qui possè¬ 
dent la propriété x =y sont des couples invariants 
dans cette application : leur ensemble est appelé dia¬ 
gonale de Ex E. 

Exemple : considérons les couples (x, y) de l’ensem¬ 
ble cartésien N x f^J, N désignant l’ensemble des nom¬ 
bres entiers naturels. Ce sont les couples (1,1), (1,2),... 
représentés sur la figure de la page ci-contre. Si l’on 
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PRODUIT CARTESIEN 



Un arbre généalogique est l’image — souvent décorative — d’un système de relations. Ci-dessus, un fragment 
de l’arbre généalogique historié de la Maison des Habsbourg. 


applique à cet ensemble la symétrie canonique qui 
transforme (x, y) en (y, x), on obtient un nouvel 
ensemble dont les éléments sont les coùples (1,1), 


(2,1), etc. Les éléments (1,1), (2,2), (3,3), ... sont 
invariants : ce sont les éléments diagonaux (on les a 
représentés en bleu sur le quadrillage ci-contre). 


Symétrie canonique transformant l’ensemble des (x, y) de la figure I en l’ensemble des (y, x ) de la figure II, xety 
étant des entiers naturels ; en bleu les éléments diagonaux (invariants dans la symétrie canonique). 




• Produit de plusieurs ensembles. Soit trois 
ensembles E, F et G distincts ou non, auxquels 
appartiennent respectivement les éléments x, y et z. 
L’ensemble des triplets (x, y, z) est l’ensemble produit 
Ex Fx G, auquel on généralise sans difficulté toutes 
les définitions précédentes. Si l’on représente chacun 
de ces ensembles par les points (ou par certains 
points) de trois droites Ox, Oy et Oz formant un trièdre 
trirectangle, les points (ou certains points) de l’espace 
tridimensionnel sont l’image du produit E x F x G (voir 
figure ci-après). 


Ensemble G(z£ G) 



Ensemble F 
(ye F) 


f 

i Image du produit de trois ensembles E, F et G. Les 
c images des éléments x, y et z appartenant respecti- 

w vement aux ensembles E, F et G sont des points des 

iîj droites Ox, Oy et Oz (E, F et G sont des ensembles 
^ continus, tels que l’ensemble des réels R par exem- 
' pie, tous les points de chaque droite sont des images 
de leurs éléments). Les éléments du produit 
■§ E x F x G sont des points tels que M(x, y, z). 

O 

-J 


£ 

o Lorsqu’une fonction f est définie dans un produit de 
*5 trois ensembles(c’est-à-dire par une relation entre des 
J éléments x, y et z de ces trois ensembles) elle est dite à 
| trois arguments dont chacun parcourt l’un des ensem¬ 
bles considérés. La valeur de f pour l’élément (x, y, z) 
du produit E x Fx G se note f(x, y, z) ; l’ensemble 
des triplets (x, y, z) qui vérifie la relation fonctionnelle 
est le graphe de la fonction. En général, pour tracer 
l’image de ce graphe, il sera nécessaire de faire appel à 
la géométrie dans l’espace. 


• Propositions fondamentales relatives au pro¬ 
duit cartésien. Dans ce qui suit on considère le produit 
cartésien E x F ; A et A' désignent des sous-ensem¬ 
bles quelconques de E, B et B' des sous-ensembles 
quelconques de F, C un sous-ensemble quelconque 
du produit E x F. La relation : « x est premier élément 
du couple z >> détermine une application de E x F dans 
E qu’on désigne par pr, ( première projection) ; la 
relation : « y est deuxième élément du couple z» est 
une application de E x F dans F, désignée par pr 2 . 


Propositions fondamentales relatives au produit 
cartésien. 


N° Proposition 

29 A x B = 0O « A - 0 ou B = 0 ». 

30 (A x B) U (A 1 x B) = (A U A’) x B. 

31 (A x B)n(/Vx B') = (A H A')x(Sn B'). 

32 pr y \A) = A x F ; pr 2 \B) = Ex B. 

33 Si B A 0, on a pour tout A : pr,(A x B) = A. 

34 Pour tout C on a : C C pr^(C) x pr 2 (C). 

En appelant K une partie de E x F et en 
considérant l’application qui fait correspondre à 
A l’ensemble K(A), ôn a : 

35 K(0) = 0. 

36 (A C B)<$K(A) C K(B). 

37 K(A U B) = K(A) U K(B). 

38 K{A fl6)Ç K{A) fl K(B). 

39 Si K et K" sont des parties de E x F telles que 
K C K’, on a K(A) C K’(A). 
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La musique et les nombres. 

Les Pythagoriciens furent sans doute les premiers à découvrir qu’il existait une relation entre la qualité 
harmonique des accords sur une lyre et les rapports entre les longueurs des cordes pincées ; ils virent dans 
cette vérité expérimentale une illustration de leur principe fondamental, à savoir que le monde est régi par les 

nombres. 


ARITHMÉTIQUE ET 
THÉORIE DES NOMBRES. 


Remarques historiques. 

L'arithmétique des Anciens. 

Précédemment pp. 7-8, nous avons récapitulé l’es¬ 
sentiel des connaissances arithmétiques classiques. 
Les Anciens étaient parvenus à la notion abstraite de 
nombre entier, telle que l’a définie axiomatiquement 
Euclide, et avaient découvert, tantôt par hasard, tantôt 
par une réflexion méthodique, quelques propriétés 
fondamentales des nombres entiers. Rappelons quel¬ 
ques têtes de chapitres importantes : représentation 
figurée des nombres (arithmo-géométrie des Pythago¬ 
riciens), qui met en évidence certains caractères de 
divisibilité et l’existence des nombres premiers ; théo¬ 
rie des proportions (Archytas de Tarente, Eudoxe, 
Théon de Smyrne) ; nombres « pythagoriciens », c’est- 
à-dire tels que le carré a 2 de l’un d’eux soit égal à la 
somme des carrés des deux autres b 2 + c 2 ; irrationa¬ 
lité de V2, V3, ..., Vf7 (Théétète) ; problèmes de 
numération (Archimède). 

Les mathématiciens arabes. 

• Rappel chronologique. Quand on parle de la 
« science arabe », on fait allusion aux nombreuses et 
brillantes Écoles scientifiques qui se sont développées 
dans le monde musulman entre le VII e et le XV e siècle. 
Comme on le sait sans doute, le dénominateur culturel 
commun de ce monde composite fut la religion 
(l'Islam) et la langue (I arabe écrit , fixé au début du 
VIII e siècle). Toutefois les savants et philosophes du 
monde islamique ne furent pas tous d’origine arabe ; il 
y a parmi eux une notable proportion de Persans (qui, à 
partir du X e siècle, écriront souvent dans leur langue, 
transcrite à l’aide de caractères arabes), quelques Juifs 
et, à partir du XIV e siècle, des Turcs. 

Les centres culturels les plus importants ont été : 
Bagdad, Baèra, Damas, Alep, Mossoul, Samarra, Ray 
(près de Téhéran) et, plus tardivement, Le Caire ; en 
Occident, la science et la culture arabes ont été diffu¬ 
sées à partir des Universités espagnoles : Cordoue, 
Grenade, Tolède, Séville; à partir du XIII e siècl^e, 
Samarkand, qui devait devenir la capitale de Timur 
Lang (Tamerlan) est un centre scientifique important, 
où le prince mongol Ulug beg fit édifier un observatoire 
célèbre. La page 135 récapitule les grands noms des 
mathématiques arabes, parmi lesquels on retiendra 
ceux d’al-Hàrizmï (IX e siècle, créateur de l’algèbre), 
d’al-Mâhàni (deuxième moitié du IX e siècle : théorie 
des proportions), du Persan ‘Umar Hayyàm (poète et 
mathématicien, deuxième moitié du XI e siècle), de 
Naslr ad-Dïn at-Tüsï (deuxième moitié du XIII e 
siècle, auteur d’un traité de trigonométrie), al-Kàsï 
(XV e siècle), introducteur des fractions décimales. 

• Le savoir arithmétique des mathématiciens 
arabes est un développement et une analyse de celui 
des Grecs. Nous retiendrons trois thèmes essentiels. 

— ‘Umar Hayyàm et at-Tüsï ont généralisé la 
formule euclidienne donnant le carré du binôme 
(a+ b). At-Tüsï, qui fut avec al-Hàrizmï le plus grand 
mathématicien arabe, énonce la formule : 

(a + b) n - a" = 

= na b -l-^-- a 2 b 2 + ••• + b " (1) 

et se sert de cette formule pour extraire les racines 
approchées d’ordre n. 

La relation (1) n’est autre que le développement du 
binôme de Newton, qui débouche sur de nombreuses 
applications (calcul combinatoire, analyse, etc.). Mais 
ce savoir ne fut pas transmis aux algébristes euro¬ 
péens, qui durent le redécouvrir, au XVII e siècle. 

— Al-Hàrizmï et ses successeurs ont calculé 
sur les nombres irrationnels. Ils ont établi des règles 
générales comme : 

X r ab~= X a VF ; Va VF = 'x / a m b n ; etc. (2) 

Ainsi les grandeurs irrationnelles, que les Grecs asso¬ 
ciaient à des constructions géométriques, deviennent 
peu à peu des nombres, c’est-à-dire des objets sur 
lesquels on peut calculer. 

— On doit enfin à ‘Umar Hayyàm et al-Màhàni 
une analyse très fine de la théorie des proportions. 

De la Renaissance au XIX e siècle. 

• Les mathématiciens de la Renaissance, on l’a 
déjà dit, ont été principalement des algébristes, préoc¬ 


cupés par le problème de la résolution des équations 
d’un degré supérieur à 3. La parution de « manuels » 
pratiques d’arithmétique, au XV e siècle, montre cepen¬ 
dant que le savoir arithmétique est largement diffusé et 
utilisé à cette époque (l’ Arithmétique de Trévise, 1478, 
d’un auteur inconnu ; le Bamberger Rechenbuch, 
1483 ; le Manuel de calcul publié par Johann Widmann 
en 1489 sont les traités les plus célèbres). Dans tous 
ces ouvrages, sont exposées les règles de la multiplica¬ 
tion, de la division, de l’extraction des racines carrées, 
de la sommation des termes d’une progression arith¬ 
métique ou géométrique, de la preuve par 9 ; on y 
trouve aussi la règle de 3, les méthodes de résolution 
des problèmes sur les mélanges et les alliages et sur 
les calculs d’intérêts. 

• Au XVII e siècle naît officiellement la théor e 
des nombres, aux frontières de l’arithmétique et de 
l’algèbre, avec les recherches de Fermât, entre 1638 et 
1658. On doit à Fermât de nombreuses propositions, 
dont on ignore s’il les a démontrées, et qui ont fait, 
depuis, l’objet d’analyses très approfondies. Nous 
retiendrons ici deux découvertes importantes dues à 
Fermât : 

1 - La méthode dite de descente infinie, qui joue 
un rôle important en arithmétique. 

2 - Le fameux « dernier théorème de Fermât », 
non encore démontré. L’étude de ce théorème a 
conduit Euler, D’Alembert, Sophie Germain, Dirichlet, 
Kummer, Gauss et d’autres mathématiciens à d’impor¬ 
tantes découvertes concernant les nombres entiers et 
la généralisation de la notion de nombre. 

3 - Fermât a énoncé la loi combinatoire donnant 
le nombre de combinaisons obtenues en rangeant n 
objets p à p, nombre qui s’écrit classiquement C,f ou 

(p ) ■ A vrai dire, cette loi était déjà connue de divers 
auteurs, sous une forme plus ou moins générale. 
Pascal en donne une démonstration, en 1654, dans son 
■traité sur le triangle arithmétique. 


• Au XVIII e siècle, les mathématiciens ont été 
principalement préoccupés de faire progresser l’ana¬ 
lyse. La théorie des nombres tient cependant une place 
importante dans les travaux d’Euler, de E. Waring et de 
Lagrange : il faut toutefois attendre l’œuvre de Le 
Gendre et de Gauss pour que cette branche des 
mathématiques se définisse comme un ensemble 
ordonné de connaissances. 

XIX e et XX e siècles. 

Au XIX e siècle, grâce aux travaux de Le Gendre 
(entre 1798 et 1830) et de Gauss (1801), tous les 
résultats entièrement acquis sur la théorie des nom¬ 
bres sont systématisés et la théorie devient une bran¬ 
che rigoureuse et coordonnée des mathématiques. 
L’œuvre tout à fait exceptionnelle de Gauss ( Recher¬ 
ches arithmétiques, publiées en latin en 1801) introduit 
notamment en mathématiques un souci de rigueur qui 
annonce les mathématiques modernes, telles que les 
concevront les savants du XX e siècle. Sans entrer dans 
les détails de l’apport de Gauss et de ses successeurs, 
détails dont les principaux seront expliqués par la 
suite, retenons ici l’introduction et l’exploitation du 
concept de congruence, la notion d’ imaginaires de 
Galois, la théorie des formes quadratiques (Gauss, 
Dirichlet, Hermite, etc.), l’élargissement de la notion de 
nombre à partir de réflexions sur le dernier théorème 
de Fermât par Gauss (1832) et par Kummer (1844, les 
nombres idéaux). Deux domaines ont été particulière¬ 
ment approfondis : celui de la répartition des nombres 
premiers (Le Gendre) et celui des nombres transcen¬ 
dants (Liouville, 1844 ; Lindemann, 1882). 

Ainsi la théorie des nombres, branche initialement 
arithmétique des mathématiques, s’oriente vers l’algè¬ 
bre (avec la généralisation de la notion de nombre), 
vers la théorie des fonctions (avec l’étude de la réparti¬ 
tion des nombres premiers et des problèmes du même 
genre) et vers la théorie des ensembles (avec la théorie 
des nombres transcendants). 
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• Au XX e siècle, ces orientations se précisent 
et la théorie des nombres devient le point de conflu¬ 
ence de disciplines mathématiques diverses, qu’il 
s’agisse de l’approximation des nombres algébriques 
(Thue, Siegel, Dyson, F.K. Roth), de la théorie des 
nombres premiers (J. Hadamard, E. Landau, A. Sel- 
berg, P. Erdôs) pour laquelle certains spécialistes ont 
fait usage de calculateurs électroniques (travaux de 
J.C.P. Miller et de D.J. Wheeler), du problème dit de 
« Waring » et des nombres transcendants (Pisot, 
Salem, Siegel, etc.). 

Signalons à ce sujet la dernière grande synthèse sur 
la théorie des nombres déjà ancienne : elle est due à 
L. E. Dickson, auteur d’une History of the Theory of 
Numbers (Histoire de la théorie des nombres), parue 
entre 1919 et 1923. Les principaux résultats obtenus 
depuis 1840 ont été récapitulés par les Mathematical 
reviews, publiées aux États-Unis. 


L'ensemble N des entiers. 

Les nombres entiers sont les nombres avec lesquels 
l’homme compte les objets qu’il perçoit ou qu’il 
conçoit ; on a coutume de les qualifier de naturels. 
L’ensemble des entiers naturels, désigné par le sym¬ 
bole f^J* (lire « r^J étoile ») est illimité : 

N* = {1,2,3...}. (1) 

Lorsqu’on adjoint à N* le nombre zéro, représenté 
par le symbole « 0 », on parle de Vensemble des entiers 
(= ensemble des entiers naturels + le zéro), qu’on dési¬ 
gne par le symbole N : 

N={0, 1,2,3,...}. (2) 

On peut faire, sur les éléments de N, des opérations 
très variées qui, astucieusement combinées, permet¬ 
tent de résoudre bien des problèmes théoriques ou 
pratiques. De plus, à partir de l’ensemble N, on peut 
construire d’autres ensembles qui jouent un rôle capi¬ 
tal en mathématiques (par exemple l’ensemble R des 
réels). Il est donc très important de décrire correcte¬ 
ment cet ensemble, c’est-à-dire : 

1 - d’énoncer un système d axiomes fixant sa 
nature ; 


Karl Friedrich Gauss (1777-1855) : aussi génial 
que ses contemporains Beethoven (1770-1827), Hôl- 
derlin (1770-1843), Hegel (1770-1831), auxquels il a 
survécu. Il est mort l’année où le poète américain 
Walt Whitman publiait Leaves of Grass ; Rimbaud 
avait un an. 



2 - de définir, en s’appuyant sur ces axiomes, 
des opérations dans N, ce qui lui conférera une 
structure (sur la notion de structure d’un ensemble, 
voir p. 37) ; 

3 - de tirer de ces axiomes et définitions des 
conséquences dont l’ensemble constitue les théorè¬ 
mes de l’arithmétique élémentaire : propriétés des 
opérations, règles opératoires, applications de ces 
règles opératoires à des problèmes, etc. 


Les axiomes de Peano. 


Il est maintenant classique de décrire l’ensemble N 
des entiers à partir de cinq axiomes énoncés par le 
mathématicien italien Giuseppe Peano (1889). Voici 
ces axiomes. 

I - N est un ensemble non vide. 

II - A tout x E N on peut associer un élément 
déterminé de N et un seul, noté x', appelé le succes¬ 
seur de x ; x lui-même est l’ antécédent de x'. 

III - Il y a dans N un élément, nommé zéro et 
noté 0, qui n’est le successeur d’aucun autre ; le 
successeur de zéro est noté 1 et nommé « un ». 

IV - Pour tout élément n E Net différent de zéro, 
il y a un élément x' E N et un seul tel que x' = n. 

V - ( Axiome d’induction ou de récurrence) - 
Tout sous-ensemble A de N qui contient 0 et qui 
contient aussi le successeur x' de tout xE A coïncide 
avec N (= contient tous les nombres naturels). 

Sur ces cinq axiomes, on peut bâtir toute l’arithméti¬ 
que. Soulignons l’importance de l’axiome V qui est à la 
base du raisonnement par récurrence, méthode de 
démonstration très utilisée en arithmétique dont le 
schéma est le suivant. 

Appelons P une propriété quelconque et supposons 
qu’on ait la relation suivante : 


P est vraie de 0 
P est vraie de x 


=£> P est vraie de x'. 


(3) 


Alors on peut dire que P est vraie de tout x apparte¬ 
nant à N, puisque, en vertu de l’axiome V, l’ensemble 
contenant les éléments x vérifiant la relation (3) 
coïncide avec l’ensemble des entiers. 


Propriétés remarquables de l'ensemble IU 

• N est un ensemble infini, puisque chaque 
élément x de N a un successeur x', en vertu de 
l’axiome II. 

Dans la théorie des ensembles, on appelle cardinal le 
nombre d’éléments contenus dans l’ensemble consi¬ 
déré, si celui-ci est fini. L’ensemble N étant infini, il 
possède un cardinal infini, noté X 0 (aleph 0) par Can¬ 
ton Comme on l’a dit à la p. 19, tout ensemble qui peut 
être mis en correspondance biunivoque avec l’ensem¬ 
ble possède le même cardinal K 0 et on l’appelle un 
ensemble dénombrable. Le cardinal K 0 est le plus petit 
nombre cardinal transfini. 

• On peut définir dans N une relation d’ordre : 
on dit que l’entier a est plus grand que ou égal à 
l’entier b si l’équation a = b + x a une solution xEM 
(c’est-à-dire une solution entière). On écrit alors : 

a 2 * b. (4) 

Lire : (« a plus grand que ou égal à b»). Corrélative¬ 
ment, b est dit plus petit que ou égal à l’entier a, et l’on 


Les propriétés de la relation d’ordre sont les sui¬ 
vantes : 


— x 25 y et y 2= x O x = y ; 

— x»y et yszoxsz; (6) 

— pour tout couple (x, y) appartenant à N, 

on a soit x s* y, soit y x. 

• L ’ensemble N est en outre un ensemble bien 
ordonné. Cette propriété peut s’énoncer ainsi : dans 
tout sous-ensemble non vide A de N il y a un nombre 
1 E A tel que 1 a pour tout a E A. 


Opérations dans N. 

On définit dans N deux opérations internes — 
c’est-à-dire dont le résultat est un élément de N — à 
savoir Vaddition et la multiplication. 

• Addition. Cette opération, désignée par le 
signe « + », est définie par les formules suivantes (en 
notant x' et y' les successeurs des entiers x et y, 
comme dans les axiomes de Peano) : 
i x + 1 = x' ; 

] x + y' = (x + y)' ; (7) 

( 0 + x = x . 

L’entier 0 est dit élément neutre pour l’addition 
(combiné selon les règles de l’addition à tout x E N, il 
donne x). En s’appuyant sur les axiomes de l’ensem- 
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ble N, on peut montrer les lois suivantes relatives à 
l’addition, pour tout x, y, zEM : 

{ associativité : {x + y)z = x + (y + z) \ 
commutativité : x + y = y -I- x. 


• Multiplication. Cette opération, désignée par 
le signe « x » ou « . » (le point peut être omis lorsque 
les nombres sont représentés par des lettres et qu’il n’y 
a pas d’ambiguïté possible), se définit par les formules 
suivantes : 

il * = x ; 

1 xy' ~ xy + x ; ( 9 ) 

Ox = 0. 

L’élément 1 est I élément neutre pour la multiplica¬ 
tion. Les lois de la multiplication sont les suivantes : 

associativité : (xy) z = x(yz) ; 
commutativité : xy = yx. ^ ' 

L’addition et la multiplication sont liées en outre par 
la loi de distributivité : 

z(x + y) = zx + zy. 

• Remarques : 

1 - La relation d’ordre est compatible 
l’addition et la multiplication ; on a en effet : 

a2=b=>a + c25b + c; 
a 2* b ac s? bc. 

2 - La soustraction a - b = x n’est possible que 
si a ^ b ; le nombre entier x est alors appelé différence 
entre a et b. Si a < b, la soustraction n’a pas de sens 
dans N. 

3 - La division de a par b est une opération qui 
associe à deux entiers a et b des entiers q et r tels 
que : 

a = bq + r, avec r< b. 

Lorsque r = 0, on a : a = bq et b est un diviseur de a 
(on dit aussi que a est un multiple de b). 

Conclusion. 

Le lecteur trouvera, p. 136 un certain nombre de 
résultats classiques sur les entiers et concernant les 
systèmes de numération (en particulier le système 
binaire et le système décimal), la pratique des opéra¬ 
tions fondamentales et l’extraction des racines car¬ 
rées, la recherche du diviseur d’un nombre, et celle du 
PGCD et du PPCM de deux nombres. Ces résultats 
sont aussi valables pour les entiers relatifs dont il est 
question ci-après p. 27. 


( 11 ) 

avec 

( 12 ) 


Les nombres premiers. 


Définition. 

Un nombre entier naturel différent de 0 et de 1 est dit 
premier lorsqu’il n’admet d’autre diviseur que 
lui-même et l’unité. Par exemple : 

2, 3, 5, 7, 11, 13, 17, 19, ... 

sont des nombres premiers. On précise parfois 
« premier absolu » pour les distinguer des nombres 
premiers entre eux, c’est-à-dire de nombres qui n’ont 
pas de diviseur commun autre que l’unité. 

Ce sont les Grecs qui, les premiers, ont constaté que 
certains nombres n’avaient pas de diviseur autre 
qu’eux-mêmes et l’unité, et ils ont cherché à en étudier 
les propriétés. Euclide a montré que l’ensemble des 
nombres premiers était infini et le géographe et mathé¬ 
maticien Ératosthène, correspondant d’Archimède, a 
inventé une méthode pour écrire la suite des nombres 
premiers : le crible d’Ératosthène (voir ci-après). 

Nous verrons ci-après (p. 28 et p. 32), que la notion 
de nombre premier peut être généralisée à d’autres 
nombres que les entiers naturels, et en particulier aux 
entiers relatifs et aux nombres complexes. 

Théorème fondamental de l'arithmétique. 

Tout nombre entier naturel peut être mis sous la 
forme d’un produit de facteurs premiers, d’une façon et 
d’une seule : 

a= P, P 2 P 3 - Pn- ( 1 ) 

Quand on dit que la décomposition est unique, on 
entend « à l’ordre des facteurs près ». 

Pour établir l’égalité (1), il suffit de diviser le nombre 
a donné par les nombres premiers successifs 2, 3, 5,... 
jusqu’à ce qu’on aboutisse à un quotient égal à l’unité. 
Par exemple, soit a = 6 600. Effectuons toutes les 
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Voici un petit problème amusant en rapport avec la théorie des nombres premiers. L’illustration ci-dessus représente une bataille sur laquelle on donne les renseignements 
suivants : si l’on multiplie entre eux, 1° : l’année de la bataille divisée par 25, 2° : le numéro du mois où cette bataille a eu lieu (janvier = 1, février = 2, etc.), 3° : le nombre de lettres 
de la ville assiégée, objet de cette bataille, 4° : l’âge de l’un des trois grands capitaines français qui périrent au cours de cette bataille, 5° : la longueur, en centimètres, d’une 
pertuisane utilisée dans cette bataille, on obtient comme produit 5 665 070. De quelle bataille s’agit-il et quel était le nom du capitaine dont il vient d’être question, sachant que les 

cinq nombres dont on a fait le produit sont tous des nombres premiers ? 

La décomposition de 5 665 070 en facteurs premiers est unique ; elle donne : 5665 070 = 2 x 5x 37 x 61 x 251. Le facteur correspondant à l’année de la bataille est 37 ou 61 
(27 x 25 = 925 ; 61 x 25= 1525) ; or la pertuisane est une arme qui n’a été d’un usage courant qu’à partir de Louis XI : donc l’année 925 est à rejeter, et la bataille a eu lieu en 1525. 
Une chronologie historique nous apprend que la bataille de Pavie (5 lettres) a eu lieu le 24 février (mois n° 2) 1525, c’estdonc la bataille cherchée. Le facteur 251 est la longueur de la 
pertuisane, car 37 ne pourrait convenir. Quant au facteur 37, c’est l’âge d’un des trois capitaines morts devant Pavie, à savoir l’amiral de France Bonnivet, né en 1488, mort à 37 ans ; 
les deux autres capitaines morts à Pavie, La Trémoille et La Palice, avaient 65 et 55 ans. Peinture sur bois de Jan Cornelisz Vermeyen, 1525 (détail). 


divisions possibles par 2, par 3, etc., en appelant q v 
q 2 , ... les quotients successifs : 


6 600 
2 

3 300 
2 

1 650 
2 


=> q i 


=> q 2 
=> q 3 


3 300 ; 
1 650 * 
825. 


( 2 ) 

(3) 

(4) 


Le nombre 825 n’est pas divisible par 2 ; on essaye la 
division par 3 et l’on trouve : 


825 

--^“ = 275 . 


(5) 


Le nombre 275 n’est pas divisible par 3, la division 
par 5 donne les quotients q 5 = 55 et q 6 = 11. Le 
nombre 11 lui-même est premier. On dispose les 
opérations comme suit, en écrivant en colonne les 
quotients successifs : 


6 600 
3 300 
1 650 
825 
275 
55 
11 
1 


2 

2 

2 

3 

5 

5 

11 


La décomposition d’un nombre en facteurs premiers 
est indispensable pour résoudre certains problèmes 
classiques d’arithmétique (recherche du PPCM ou du 
PGCD de deux nombres, etc. ; voir p. 137). 


Crible d'Ératosthène. 

• Pour vérifier si un nombre est premier, on 
peut évidemment essayer de le diviser par tous les 
nombres entiers inférieurs à lui : si aucune division 
n’est possible, le nombre est premier. Mais cette 
méthode est très peu commode, même si on se sert de 
calculatrices électroniques. Ératosthène a inventé une 
méthode plus simple, appelée crible d’Ératosthène. 

Supposons que nous recherchions les nombres pre¬ 
miers inférieurs à 100. Inscrivons d’abord la suite des 
entiers, de 1 à 100, en supprimant les nombres pairs 
qui ne sont évidemment pas premiers (à l’exception de 
2). On obtient le tableau suivant : 


1 

3 

5 

7 

9 

11 

13 

15 

17 

19 

21 

23 

25 

27 

29 

31 

33 

35 

37 

39 

41 

43 

45 

47 

49 

51 

53 

55 

57 

59 

61 

63 

65 

67 

69 

71 

73 

75 

77 

79 

81 

83 

85 

87 

89 

91 

93 

95 

97 

99 


1 - On barre sur ce tableau les multiples de 3, de 
5 et de 7 ; on obtient le tableau réduit suivant (en 
conservant les nombres 3, 5 et 7) : 


Le nombre 6 600 s’écrit donc : 

6 600 = 2x2x2x3x5x5x11, (6) 

ou, en utilisant la notation exponentielle : 

6 600 = 2 3 x 3 x 5 2 x 11 . (7) 


1 

3 

5 

7 

0 

11 

13 

>4 

17 

19 

& 

23 



29 

31 

34 

34 

37 

34 

41 

43 


47 

44 

6 ^ 

53 

64 


59 

61 

$6 


67 

64 

71 

73 

74 

7* 

79 


83 


yf 

89 


34 

34 

97 

34 


2-11, qui n’est divisible par aucun nombre que 
par lui-même ou l’unité, est premier. Barrons les 
multiples de 11 : nous remarquons immédiatement que 
2x11, 3x11, 4x11, 5x11, 6x11, 7x11, 8x11, et 
9x11 ont déjà été barrés, au cours de l’opération 
précédente. Le premier multiple de 11 qui reste à 
éliminer est 11 x 11 =121 :il n’est pas compris dans le 
tableau. Il n’y a donc aucun multiple de 11 à barrer ; de 
même les multiples de 13 inférieurs à 100, les multiples 
de 17 inférieurs à 100, etc., ont été barrés dans le 
tableau. En conséquence les nombres non barrés 
restants, à l’exception de l’unité, sont des nombres 
premiers. Pour avoir l’ensemble des nombres premiers 
inférieurs à 100, il suffit d’ajouter 2 à cet ensemble 
restant, d’où : 
nombres premiers < 100 

= \ 2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41,> 
if43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97 ) 

• L’ensemble des nombres premiers est infini. 
On peut démontrer très simplement que, quel que soit 
le nombre entier n, il y a au moins un entier supérieur à 
n. Pour cela, considérons le nombre défini par : 

A = 1 x 2 x 3 x ••• x (n + 1). (8) 

1 - Ou bien A est premier : alors la proposition 
est démontrée, puisque A est supérieur à n. 

2 : Ou bien A n’est pas premier : alors il admet 
au moins un diviseur premier p (d’après le théorème 
fondamental de l’arithmétique). Or la division de A par 
un nombre inférieur à n donne pour reste 1 en vertu de 
la formule (8) ; donc le diviseur premier p de A est 
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obligatoirement supérieur à n : il existe donc un 
nombre premier supérieur à n. 

Répartition des nombres premiers. 

Il y a quelque chose d’irritant pour l’esprit dans la 
notion de nombre premier : on ne connaît pas la loi qui 
régit leur répartition. Le problème a été abordé notam¬ 
ment par Dirichlet et par Riemann, au XIX e siècle ; il a 
été repris, sur des bases statistiques, dans les années 
1950, grâce à l’apparition des calculatrices électroni¬ 
ques. 

• Théorème de Dirichlet Toute progression 
arithmétique (voir p. 119) dont le premier terme et la 
raison sont des entiers premiers entre eux contient 
une infinité de nombres premiers. 

Appelons a le premier terme d’une progression 
arithmétique et r sa raison ; la progression s’écrit : 

a, a+r, a + 2 r,..., a + (n- 1) r, ... (9) 

Une progression arithmétique est une fonction de la 
variable entière n ; le terme de rang n a pour valeur : 

f{n) = a+ (n - 1) r. (10) 

Le théorème de Dirichlet s’énonce alors ainsi : parmi 
l’ensemble des valeurs f{n) de la fonction définie par 
l’équation (10), il y a une infinité de nombres premiers. 

On peut démontrer une proposition analogue à 
propos d’autres fonctions f(n), par exemple pour la 
fonction de Mersenne : 

f(n) = 2 n — 1 , (11) 

ou la fonction de Fermât : 

f(n) = 2 * 1 2 3 * * * * * * "+1. (12) 

A l’aide de calculatrices électroniques, on peut cal¬ 
culer des valeurs f(n) qui sont des nombres premiers. 
Le plus grand nombre premier connu à l’heure actuel 
semble être le nombre : 

f(n) = 2 4423 — 1 (13) 

(c’est un nombre d’environ 1 200 chiffres !). 

• Raréfaction des nombres premiers. 

— En s’appuyant sur les recherches de Riemann 
relatives à la fonction zêta (zêta est le nom de la lettre 
grecque Ç) : 

i(s)=1+i + ^- + --+-V + -, (14) 

z o n 

J. Hadamard et La Vallée-Poussin ont montré que le 
nombre N de nombres premiers inférieurs à un entier x 
tend asymptotiquement vers : 


(In x désigne le logarithme népérien de x, voir sa 
définition p. 112). On en conclut que le nombre 
premier de rang N a approximativement la valeur 
suivante : 

x ^ N In x. (16) 

L’équation (16) s’écrit encore, en tenant compte de la 
propriété fondamentale des logarithmes (le logarithme 
d’un produit égale la somme des logarithmes) : 

In x 2 = In N + In (In x). (17) 

Comme In (In x) est très petit par rapport à In x, on 
peut écrire : 

In x — In N. (18) 

De sorte que l’équation (16) s’écrit : 

x^N\nN. (19) 

• Remarques : 

1 - La formule (15) est assez éloignée de la vérité 
pour x petit ; par exemple, pour x=100, on a 
In 100 = 4,605 17 et N ^ 21,7. Le calcul direct montre, 
en fait, que N = 25 (voir ci-dessus le crible d’Ératos- 
thène). 

2 - Quand x croît, In x croît, donc 1/lnx 
décroît. De sorte que la proportion A//x = 1/ln x de 
nombres premiers inférieurs à x décroît aussi. Il y a 
raréfaction des nombres premiers quand x augmente. 
On exprime encore cette propriété en disant que la 
répartition des nombres premiers est asymptotique 
(pour la notion d’asymptote, voir la théorie des fonc¬ 
tions, p. 112). 

3 - On peut préciser la formule (15) en faisant 
appel à des méthodes de haute analyse mathématique 
qui ne seront pas exposées ici. 

Propriétés remarquables des nombres premiers. 

• Théorème de Fermât. Fermât a énoncé le 
théorème suivant, qui fut démontré par ses succes¬ 
seurs : 


« soit p un nombre premier quelconque et a un entier 

non divisible par p. La différence a p_1 - 1 est divisible 

par p. » 

Prenons par exemple a = 10et p = 11 ; on a: 

a p-i_1 = 10 10 — 1 =9 999 999 999, (20) 

et le lecteur constatera aisément que ce nombre est 
divisible par 11. 

• Somme de carrés. 

— Si un nombre premier divise la somme de 
deux carrés premiers entre eux, il est lui-même la 
somme de deux carrés. 

— Tout nombre premier de la forme 4 n+ 1 est 
la somme de deux carrés. 

— Tout nombre premier impair qui divise une 
somme de quatre carrés est lui-même une somme de 
quatre carrés. 

L'ensemble IL des entiers relatifs 
et la théorie des congruences. 

Le but de ce paragraphe n’est pas d’énumérer 
quelques propriétés spectaculaires des nombres 
entiers, bien qu’un tel exposé ne manque pas d’inté¬ 
rêt : il suffit de voir la place prise dans les revues 
scientifiques contemporaines par les « récréations 
mathématiques ». Certaines de ces récréations ont 
d’ailleurs joué un rôle de premier plan dans l’élabora¬ 
tion de la théorie des nombres (les premières en date et 
les plus célèbres sont sans doute le problème posé par 
Archimède dans L 'arénaire, sur la représentation du 
nombre de grains de sable qu’il y a sur la Terre, et le 
problème des bœufs, posé par le même auteur). Ce 
que nous nous proposons ici c’est d’aborder certaines 
propriétés des entiers dont l’étude a permis la générali¬ 
sation de l’arithmétique et débouche sur les branches 
les plus abstraites des mathématiques. 

Les propositions de Fermât. 

• Le dernier « théorème » de Fermât. Nous y 
avons fait allusion à plusieurs reprises : il s’agit de 
trouver trois nombres entiers x, y, z vérifiant la rela¬ 
tion : 

x" + y" = z". (1) 

Fermât a affirmé (sans démonstration : c’est une 
« conjecture » et non un « théorème ») que l’équation 
(1 ) est impossible lorsque n est un entier supérieur à 2. 

— Pour n = 0, l’équation (1) s’écrit: 

x° + y 0 = z° , (2) 

soit, avec la convention x° = 1 (sur le calcul des 
exposants, voir p. 139) : 

1+1=1, (3) 

relation qui est manifestement fausse. Ainsi donc nous 
devons écarter le cas n = 0. 

— Pour n = 1, l’équation (1) s’écrit : 

x + y = z (4) 


Pierre Fermât (1601-1665), mathématicien français 
dont les travaux sont à l’origine de la théorie des 
nombres et du calcul infinitésimal. 



et le problème revient à trouver trois entiers dont l’un 
soit la somme des deux autres, ce qui est toujours 
possible. 

— Pour n = 2, l’équation (1) s’écrit: 

x 2 + y 2 = z 2 . (5) 

La géométrie nous enseigne (théorème de Pytha- 
gore) que c’est là la relation qui existe entre les côtés x 
et y et l’hypoténuse z d’un triangle rectangle. Pour 
résoudre (5), il faut donc trouver un triangle rectangle 
dont les côtés soient mesurés par des nombres entiers. 
Un triplet (x, y, z) vérifiant l’équation (5) est appelé 
pythagoricien. Les Anciens savaient que tout triangle 
dont les côtés étaient proportionnels à 3, 4, 5 était un 
triangle rectangle ; on a en effet : 

3 2 + 4 2 = 5 2 . (6) 

La construction d’autres triplets pythagoriciens, 
c’est-à-dire la solution générale de l’équation (1) pour 
n = 2, se fait selon la règle suivante : on se donne deux 
entiers premiers entre eux (c’est-à-dire n’ayant pas de 
diviseur commun) p et q, tels que p > q et que leur 
parité soit opposée (si p est pair, q est impair et 
réciproquement). On a alors les solutions de (1) : 

X = 2 pq ; y = p 2 - q 2 ; z = p 2 + q 2 . (7) 

D’autre part tout triplet proportionnel au triplet (x, y, 
z) trouvé est aussi pythagoricien : ainsi les triplets (6, 8, 
10), (9, 12, 15) qui sont proportionnels à (3, 4, 5) sont 
pythagoriciens. Voici le début d’une table de nombres 
pythagoriciens qui peut être évidemment prolongée à 
l’infini. 


p q 

2 1 

3 2 

4 1 

4 3 

5 2 

5 4 

6 1 

6 5 

etc. 


x = 2 pq 


4 

12 

8 

24 

20 

40 

12 

60 


y = p 2 -q 2 


3 

5 

15 

7 

21 

9 

35 

11 


z = p 2 + q 2 


5 

13 

17 

25 

29 

41 

37 

61 


Nombres pythagoriciens 

— Pour n > 2, l’équation (1) n’a pas de solution 
entière. Cette propriété a été démontrée dans un 
certain nombre de cas particuliers : 

1 - La démonstration pour n = 4 se fait à l’aide 
d’une méthode mise au point par Fermât et appelée 
méthode de descente infinie. Une fois établi que le 
théorème de Fermât est vrai pour n = 4, on montre que 
la démonstration générale du théorème revient à 
démontrer que la proposition de Fermât est vraie pour 
n premier et différent de 2. 

2 - La démonstration du théorème de Fermât 
pour n = 3 utilise une méthode définie par Euler ; 
Le Gendre et Dirichlet l’ont montré pour n = 5, Lamé, 
pour n = 7 et Dirichlet pour n = 14 ; Sophie Germain a 
en outre établi un théorème divisant le théorème de 
Fermât en deux cas : 1° le cas où x, y, z sont divisibles 
par l’exposant n ; 2° tous les autres cas. L’ensemble de 
ces travaux se sont déroulés dans la première moitié 
du XIX e siècle, parallèlement au développement de la 
théorie des nombres par Lagrange (1774), Le Gendre 
( Théorie des nombres, 1830) et Gauss, dont les décou¬ 
vertes dominent toute l’histoire des mathématiques au 
XIX e siècle. 

3 - Kummer ouvrit une nouvelle voie à partir de 
1844 en introduisant une généralisation de la notion de 
nombre (Théorie des nombres idéaux). 

• Autres propositions dues à Fermât. 

— Tout nombre entier est, au plus, la somme de 
quatre carrés. 

— Tout nombre de la forme 4 n + 1 est la somme 
de deux carrés. 

— Si p est un nombre premier, alors le reste de 
la division de a p par p est a. 

— L’équation : 

Ax 2 + 1 = y 2 , (8) 

dans laquelle A est donné admet toujours un couple de 
solutions entières (x, y). L’équation (8) a été nommée 
« équation de Pell » par Euler, qui, en l’occurrence, 
avait confondu ce mathématicien avec son compa¬ 
triote et contemporain Wallis, qui avait aussi étudié la 
question. 

Généralisation de la notion de nombre entier : 
l'ensemble Z. 

• L ’ensemble Z est appelé ensemble des entiers 
relatifs (ou, plus brièvement, ensemble des entiers), 
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LES CONGRUENCES 

par opposition à l’ensemble fol des entiers naturels 
complété par le 0. Il comprend, outre le 0, les entiers 
positifs 1, 2, 3,... (c’est-à-dire les nombres naturels) et 
les entiers négatifs -1, -2, —3, ... (c’est-à-dire les 
entiers naturels précédés du signe « - »). Historique¬ 
ment, l’ensemble Z a été introduit pour donner un sens 
à une expression telle que x + 1 =0, qui entraîne, on le 
sait, x = — 1. Les règles de calcul sur les nombres 
négatifs ont été établies au XV e /XVI e siècle, sans 
démonstration. Mais la notion de nombre négatif, ainsi 
présentée, semble quelque peu arbitraire, malgré la 
justification a posteriori qu’on en a souvent donnée. 
Nous allons introduire l’ensemble Z d’une manière 
plus abstraite et plus générale, qui nous permettra de 
comprendre les règles du calcul sur les nombres 
relatifs. 

• Construction de l’ensemble Z. Partons de 
l’ensemble produit foJ x fol, composé de tous les couples 
(a, b) de nombres naturels. On peut le représenter 
graphiquement en marquant par des points sur une 
ligne horizontale les entiers naturels 1, 2, 3, ... et en 
faisant de même sur une ligne verticale. Un couple 
(a, b) de l’ensemble fol x fol est un point du plan de 
coordonnées a et b (voir figure ci-dessous). 

Définissons dans foi. x foj une relation d’équivalence % 


en écrivant que 




(a, b)%(a', b') 

(9) 

si, et seulement si 




a + b' = b + a r . 

(10) 


Tous les couples tels que (a', b') équivalents à (a, b) 
selon % forment une classe d’équivalence, que nous 
désignerons par (a, b) = x. Sur la figure ci-desso us, on 
constate que les couples équivalant à une classe (a, b) 
donnée sont alignés sur une bande diagonale (on en a 
figuré trois sur le graphique). 

L’ensemble des classes d’équivalence, c’est-à-dire 
l’ensemble des bandes diagonales du graphique, est 
appelé ensemble Z. Une classe d’équivalence particu¬ 
lière est appelée un entier relatif ou, s’il n’y a pas 
d’ambiguïté, un entier. 
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L’ensemble produit fol x N et les classes d’équiva¬ 
lence pour la relation % : a +b' = b + a' dans cet 
ensemble. Chaque élément (a, b) de foJ x foj est repré¬ 
senté par un point rouge ou noir (rouge si a < b ; noir 
si a > b) ; les couples (a, a) sont représentés par un 
point gris. On a tracé sur le graphique les classes 
d’équivalence (4, 0), (3, 0) et (0,2), matérialisées par 
des bandes grises ou rose. L’ensemble de ces 
classes est l’ensemble 1. 


• L’a dditio n dans Z. La somme de deux entiers 
relatifs x = (a, b) et y = (c, d) est un entier relatif ainsi 
défini : 

(a, b) + (c, d) = (a + c, b + d) (11 ) 

Bien noter, que dans le membre de gauche, le signe 
« + » est celui de l’addition dans Z, tandis que, dans le 
membre de droite, il désigne l’addition des entiers 
naturels a et c, b et d. 

A partir de cette définition, et en tenant compte des 
lois de l’addition dans fol, on tire les propriétés suivan¬ 
tes de l’addition dan s Z : 

1 - La classe (0, 0) est un élément neutre pour 
l’addition ; on a en effet : 

(ÔTÔ) + (âTb) = (âTB) + (ÜTÔ) = (âTb) . (12) 


Nous conviendrons donc de poser : 

(ÜTÔ) = 0. (13) 

Ici aussi, dans le membre de gauche « 0 » est le zéro 
de l’ensemble foj ; à droite, « 0 » est le zéro de l’ensem¬ 
ble Z. Si l’on craint une ambiguïté, on peut le désigner 
par 0. 

2 - L’addition dans Z est commutative et asso¬ 
ciative. 

__ 3 - La somme des deux entiers relatifs (a, b) et 
(b, a) est nulle ; en effet : 

(a, b) + (b, a) = (âT~bTâ+~b) (14) 

et la classe ( a + b , a + b ) est équivalente à (ÔTÔ) = 0. 
Les entiers (a, b) et (b, a) dont l’addition donne 
comme résultat l’élément neutre 0 sont dits opposés : 
tout entier relatif possède donc un opposé. Cette 
propriété est remarquable : elle n’existait pas dans 
l’ensemble fol. 

• Multiplication dans Z. On définit cette 
deuxième opération dans Z de la manière suivante : 

(a, b) x (c, d) = (âcT~bdTâdT~bc ). (15) 

On montre aisément qu’il s’agit d’une opération 
commutative et associative et qu’elle est distributive 
par rapport à l’addition. Le nombre (1, 0) est l’élément 
neutre pour la multiplication puisqu’on a : 

(T7Ô) x (5 7b) = (âTb) x (Ï7Ô) 

= (a + 0, 0 + b) = (a, b). (16) 

• Conventions d’écriture. 

1 - Chaque nombre rela tif (= chaque classe 
d’équivalence) de la forme (a, b) peut être représenté 
par l’élément (m, 0) ou (0, m) de la classe qui contient 
le nombre 0. Cet élément est appelé élément canoni¬ 
que. Ainsi la classe : 

(âT5) = {( 4, 0), (5, 1), (6, 2), (7, 3), ...} (17) 

sera représentée par l’élément (4, 0). De même la 
classe : 

{â~d) = {( 0,2), (1,3), (2, 4),...} (18) 

sera notée (0, 2). 

2 - On peut convenir en outre de poser : 

\ {m, 0) = + m ; 

\ (0, m) = - m ; (19) 

((0, 0) = 0 . 

Le symbole « + m » est celui de la classe d’équiva¬ 
lence dont l’élément canonique est (m, 0) ; de même 
« - m » est le symbole de la classe d’équivalence dont 
l’élément canonique est (0, m). Un entier relatif est 
donc décrit par un entier naturel m, qu’on appelle sa 
valeur absolue et par un signe (+ ou -) ; il est dit positif 
si le signe est « + » et négatif dans le cas contraire. Le 
nombre 0 n’est ni positif ni négatif. 

3 - On montre que l’ensemble Z est ordonné 
pour la relation : « ^ » ; en particulier, tout entier 
négatif est inférieur à 0 et inférieur à tout entier positif ; 
0 est supérieur à tout entier négatif et inférieur à tout 
entier positif. Enfin, de deux entiers relatifs de même 
signe, le plus grand est celui qui a la plus grande valeur 
absolue s’ils sont positifs, et celui qui a la plus petite 
valeur absolue s’ils sont négatifs. 

4 - Avec les conventions d’écriture précédentes, 
le calcul sur les entiers relatifs obéit à des règles des 
signes simples, justifiées par la définition de l’addition 
et de la multiplication. L’application de ces règles 
permet la pratique de ce qu’on nomme le « calcul 
algébrique », c’est-à-dire le calcul sur les éléments de 
l’ensemble Z, et dont les principales règles sont rappe¬ 
lées p. 138. 

5 - Isomorphisme. L’ensemble fol* (c’est-à-dire 
les entiers naturels sans le zéro) et l’ensemble Z* 
(c’est-à-dire l’ensemble des entiers positifs) sont iso¬ 
morphes (voir p. 38, la définition de l’isomorphisme). 
On peut donc identifier ces deux ensembles, et 
identifier aussi ( + m) avec m. D’où une simplification 
de l’écriture. 

• Quelques propriétés arithmétiques fonda¬ 
mentales dans Z. Dans ce qui suit, nous désignerons 
un entier relatif par une lettre a, b, c, ..., et nous 
écrirons par exemple : 

a = — 2 ; b = + 5 = 5; c = - 37 ; etc. 

— Comme dans fol, nous dirons que b est un 
diviseur ou un facteur de a, s’il existe un entier ce Z tel 
que a= bc; a est aussi appelé multiple de b, et la 
relation « b divise a» se note : bl a. 

— Un entier relatif p est dit premier s’il est 
différent de 0 et de ± 1 (lire « plus ou moins 1 ») et s’il 
n’admet comme diviseur que les nombres ± 1 et ± p. Si 
p est premier, il en est de même de son opposé - p. On 
démontre (théorème fondamental de l’arithmétique) 
que tout entier positif différent de 1 peut être écrit sous 


la forme d’un produit de facteurs premiers, et cela 
d’une seule manière (l’ordre des facteurs étant indiffé¬ 
rent). 

— On définit, comme dans fol, le PPCM et le 
PGCD de deux entiers relatifs. 

— Diviser un entier a ( dividende) par un entier b 
(diviseur), c’est trouver deux nombres q (quotient) et r 
(reste) appartenant à Z tels que : 

a = bq + r, avec r < b. (20) 

Par exemple, si a = 33 et b = - 5, on a q = - 6 et 
r = + 3, puisque : 

33 = (— 5 ) x (— 6 ) + 3 . ( 21 ) 


Théorie des congruences. 

• Remarque historique. Dans ce qui précède, 
nous avons donné des entiers relatifs une définition 
abstraite en les considérant comme des symboles 
décrivant des classes d’équivalence dans l’ensemble 
foj x foj. Cette construction de l’ensemble Z justifie après 
coup les règles opératoires relatives aux nombres 
positifs et négatifs dont les mathématiciens se ser¬ 
vaient, en Europe occidentale, depuis la Renaissance 
(voir p. 9), et elle repose sur l’importante notion de 
classe d’équivalence, qui s’est dégagée notamment 
des travaux arithmétiques de Gauss (Disquisitiones 
Arithmeticae, 1801 ; traduction française en 1806 sous 
le titre Recherches arithmétiques), faisant suite à ceux 
de Lagrange sur les Résidus quadratiques (voir ci- 
après, p. 30). Gauss a montré qu’il existait une 
analogie entre le calcul sur les classes d’équivalence 
et le calcul sur les nombres entiers. De ce point de 
vue, l’examen d’une relation d’équivalence fondamen¬ 
tale, baptisée congruence, est extrêmement féconde. 

• Définition. Voici d abord la définition donnée 
par Gauss dans les Disquisitiones Arithmeticae : 

« Si un nombre a divise la différence des nombres b et 
c, b et c sont dits congrus suivants, sinon incongrus ; a 
s’appellera le module ; chacun des nombres b et c, 
résidu de l’autre dans le premier cas et non-résidu 
dans le second. » 

Cette définition appelle un certain nombre de 
commentaires. 

1 - Par « nombre » Gauss entend ici un entier 
positif, négatif ou nul, c’est-à-dire un élément de 
l’ensemble Z. 

2-11 revient au même de dire : 

« b — c est divisible par a » 
et : 

« b et c divisés par a donnent le même reste ». 

Diviser b, c ou b — c par le nombre a, cela revient à 
le mesurer à l’aide de l’unité de mesure a. D’où le terme 
de module, du latin modulus = « mesure » pour dési¬ 
gner a. 

3 - La notation (introduite par Gauss) utilise le 
signe « = » qui se lit « est congru à ». On écrira donc : 

b = c (mod a) (22) 

et on lira : « b congru à c modulo a » (modulo est une 
forme du mot latin modulus pour désigner le complé¬ 
ment de moyen ; « modulo a » signifie donc « par 
rapport à la mesure a »). 

Dans la relation (22), et conformément à la définition 
de Gauss, c est le résidu de b par rapport au module 
a ; la congruence elle-même traduit le fait que b - c 
est divisible par a. Mais, si b — c est divisible par a, 
alors c - b est aussi divisible par a et l’on peut écrire : 

c = b (mod a). (23) 

Cette fois-ci, b est le résidu de c par rapport au 
module a. 

4 - Exemples. 

— La congruence : 

22 = 7 (mod 5) (24) 

signifie : que 22-7 est divisible par 5 et que 22 et 7 
divisés par 5 donnent le même reste (ici : 2). 

— La congruence : 

22 = x (mod 5) (25) 

n’est vérifiée que pour les valeurs de x qui, divisées par 
5, donnent 2 comme reste, par exemple x = 7, x = 12, 
x = 17,... Les valeurs de x qui satisfont à la 
congruence (25) sont les racines de la congruence 
considérée. 

— La congruence : 

x = 0 (mod 2) (26) 

signifie que x - 0 = x est divisible par 2, c’est-à-dire 
que x est un entier oair. Un entier impair y satisfait à la 
congruence . 

y = 1 (mod 2). (27) 
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5 - Soit a un entier, appartenant à Z ; le reste r 
de la division de a par p G Z est tel que : 

a = r (mod p). (28) 

Cette congruence est liée à la définition de la division 
dans Z. Appelons q le quotient de la division de a par 
p, on a, d’après la formule (20) du paragraphe b : 

a = pq + r, r < p ; (29) 

d’où : 

a - r = pq, (30) 

ce qui montre que a — r est divisible par p, propriété 
que traduit la congruence (28), dans laquelle le rési¬ 
du r, c’est-à-dire le reste de la division de a par b, peut 
prendre les p valeurs : 0, 1,2, p —1. 

6 - Les congruences peuvent donc nous servir à 
noter symboliquement des relations de divisibilité. 
Voici un exemple concret connu sous le nom de 
« problème du tisserand ». Il s’agit d’un artisan qui 
tresse des rubans circulaires (par exemple, des rubans 
pour chapeaux) avec des fils de couleurs différentes et 
qui désire fabriquer un ruban sans couture voyante. Si, 
par exemple, il emploie deux fils, on peut aboutir aux 
deux situations de la figure ci-dessous. Dans le premier 
cas (I), lorsqu’il « fermera » son ruban, en cousant a/a' 
et b/b', il obtiendra un ruban sans couture (a et a' sont 
bleus, b et b' sont noirs) ; dans le second cas (II), la 
couture sera apparente, puisque a, point bleu, viendra 
sur a', point noir, et que b, point noir, viendra sur b', 
point bleu. Après un certain nombre de tâtonnements, 
le tisserand, même s’il n’est pas mathématicien, 
constatera qu’il obtient un ruban sans couture dans le 
cas où le nombre de croisements de ses fils est un 
nombre pair, et qu’il obtient un ruban avec couture 
lorsque le nombre de croisements de ses fils est un 
nombre impair. Il pourra donc, en appelant C le 
nombre de croisements de fil noir sur fil bleu, écrire de 
la façon suivante la condition nécessaire pour que son 
ruban soit sans couture : 

C = 0 (mod 2). (31) 

Bien entendu, les congruences n’ont pas été inven¬ 
tées à l’usage des tisserands ; ce sont des relations qui 
permettent non seulement d’exprimer des faits numéri¬ 
ques simples, mais aussi de traiter de nombreux 
problèmes concernant les nombres entiers. 



il 


Le problème du tisserand. 


• Propriétés des congruences. 

— Il est facile de montrer que la relation de 
congruence est réflexive, symétrique et transitive, 
c’est-à-dire que l’on a, en appelant a, b, c et p des 
éléments de l’ensemble Z : 

a = a (mod p) ; (32) 

a = b (mod p)<^> b = a (mod p) ; (33) 

« a = b (mod p) 

et b = c (mod p) » o a = c (mod p). (34) 

La relation de congruence, étant réflexive, symétri¬ 
que et transitive, est une relation d’équivalence dans Z. 

— La relation de congruence est conservée 
pour l’addition et la multiplication dans Z. C’est-à-dire 
que si a = b (mod p), on a aussi, pour tout c G Z : 


a + c = b + c (mod p) 

(35) 

ac = bc (mod p). 

(36) 


• Classes d’équivalence dans Z. Tous les entiers 
x qui vérifient une congruence déterminée forment 
une classe d’équivalence dans Z. Par exemple tous les 
entiers tels que : 

x — 0 (mod 2) (37) 

constituent la classe des nombres pairs (c’est-à-dire 
des nombres dont la division par 2 donne 0 comme 
reste). Convenons de désigner cette classe par 0 (zéro 


LES CLASSES RÉSIDUELLES (MOD P) 


surligné) ; nous pourrons dire : « x est un 0 » ou 
« x = 0 ». De même, un nombre y tel que 

y = 1 (mod 2) (38) 

est un nombre impair ; tous les nombres y qui vérifient 
la congruence (38) forment la classe des nombres 
impairs que nous désignerons conventionnellement 
par le symbole 1. 

Plus généralement, considérons les entiers x qui 
donnent un même reste r lorsqu’on les divise par 
l’entier p, c’est-à-dire les entiers tels que : 

x = r (mod p). (39) 

La division d’un nombre par p peut donner comme 
reste les nombres : 0, 1,2, 3,..., p - 1 ; il y aura donc p 
classes de nombres dont le reste de la division par p 
est le même : 

— la classe des nombres qui, divisés par p, 
donnent pour reste 0 ; nous la noterons : 0 ; 

— la classe des nombres qui, divisés par p, 
donnent pour reste 1 ; nous la noterons : 1 ; 

— la classe des nombres qui, divisés par p, 
donnent pour reste 2 ; nous la noterons : 2 ; etc. 

Ces p classes sont appelées classes résiduelles 
(mod p), ce qui est une autre manière de dire : « les 
classes de nombres qui, divisés par p, donnent un 
même reste ». L’ensemble de ces p classes résiduelles, 
noté Z/p, est : 

Z/p = { Ô, T, 2,..., p-^T}. (40) 

Considérons, par exemple, le cas p = 6. L’ensemble 
Z/6 est l’ensembledesjclasses résiduelles (mod 6), à 
savoir les classes_[0,1,2, 3, 4, 5}. Un nombre x appar¬ 
tenant à la classe 3 est un nombre dont la division par 6 
donne comme reste 3 (par exemple : x = 15, x = 21, 
x = 27, etc.). 

• Calcul sur les classes d’équivalence. Nous 
commencerons par examiner deux exemples simples. 

— L’ensemble Z/2 des classes résiduelles 
(mod 2) contient la classe des nombres pairs et la 
classe des nombres impairs, que nous avons notées 
respectivement 0 et 1. Nous pouvons définir dans 
l’ensemble Z/2, deux opérations : l’addition et la multi¬ 
plication. Il est facile de vérifier, en effet, que : 

nombre pair + nombre pair = nombre pair, (41 ) 

ce qui s’écrit, avec nos conventions : 

Ô + Ô = Ô. (42) 

On vérifierait de même que la somme de deux 
nombres impairs est un nombre pair et que la somme 
de deux nombres de parité différente est un nombre 
impair, ce qui s’écrit : 

T+T=Ô; (43) 

Ô+î=T + (j = T. (44) 

Ces résultats peuvent être résumés dans une table 
d’addition des classes de l’ensemble Z/2 : 


+ 

0 

1 




0 

0 

1 

_ 

_ 

_ 

1 

1 

0 


Table d’addition des classes 0 et 1. 

De même, on peut établir une table de multiplication 
pour les classes de nombres pairs et de nombres 
impairs (nombre pair x nombre pair = nombre pair, 
nombre impair x nombre impair = nombre impair ; 
etc.) ce qui donne : 


x 

ü 

ï 

Ô 

ô 

ô 

T 

ô 

T 


Table de multiplication des classes 0 et 1. 

— Considérons maintenant l’ensemble Z/6 des 
classes jésiduelles (mod 6)': il comprend 6 éléments 
{ 0,1,2, 3,4, 5}, que l’on peut aussi combiner selon les 
lois de l’addition et de la multiplication en construisant 
les tables de ces deux opérations. Voici comment on 
procède sur un exemple particulier. Soit les 
nombres 21 et 17 ; divisés par 6, ils donnent respective¬ 
ment cojrime/estes 3 et 5. Ils appartiennent donc aux 
classes 3 et 5 (mod 6). Leur somme 21 + 17 = 38, divi¬ 
sée par 6, donne comme reste 2, c’est-à-dire appartient 
à la classe 2. On peut montrer que ce résultat est 
général, c’est-à-dire que l’on a : 

(entier appartenant à la classe 3) + 

-l- (entier appartenant à la classe 5) 

= (entier appartenant à la classe 2). (45) 

Ce qui s’écrit, avec nos cbnventions : 

3 + 5-2 (46) 


En procédant systématiquement pour toutes les 
combinaisons des éléments de Z/6, nous établirons la 
table d’addition des classes résiduelles (mod 6), puis la 
table de multiplication des classes résiduelles (mod 6). 
Nous donnons ces deux tables ci-après, sans justifica¬ 
tion, mais le lecteur peut s’amuser à les reconstituer 


+ 0 1 2 3 4 5 


0 

0 

1 

2 

3 

4 

5 

ï 

1 

2 

3 

4 

5 

0 

2 

2 

3 

4 

5 

0 

1 

3 

3 

4 

5 

0 

1 

2 

4 

4 

5 

0 

1 

2 

3 

6 

5 

Ô 

T 

2 

3 

4 


Table d’addition des 
classes résiduelles 
modulo 6. 


x 0 1 2 3 4 5 


0 

0 

0 

0 

0 

0 

0 

1 

0 

1 

2 

3 

4 

5 

2 

0 

2 

4 

0 

2 

4 

3 

ô 

3 

Ô 

3 

Ô 

3 

4 

0 

4 

2 

0 

4 

2 

5 

0 

5 

4 

3 

2 

1 


Table de multiplication 
des classes résiduelles 
modulo 6. 


— Voici un exemple simple de l’utilisation de la 
table de multiplication. Soit un nombre a qui, divisé par 
6, donne pour reste 4 et un nombre b qui, divisé par 6, 
donne pour reste 5. On considère le produit ab de ces 
deux nombres : quel sera le reste de la division de ab 
par 6 ? On peut répondre à cette question sans connaî¬ 
tre a et b : le nombrea appartient à la classe 4, le 
nombre b à la classe 5^ par conséquent leur produit 
appartient à la. classe 2 ,_ comme on le constate à 
l’intersection de la ligne 4 et de la colonne 5. Donc le 
produit ab, divisé par 6, donnera pour reste 2. 

— Bien entendu, le but de la théorie des 
congruences n’est pas uniquement de prévoir des 
résultats aussi simplistes. Voici un autre exemple 
« plus utilitaire », la fameuse « preuve par 9 » de la 
multiplication, bien connue de tous les écoliers. Le 
mécanisme peut s’en démonter grâce à l’ensemble des 
classes résiduelles (mod 9). 

1 - Soit un nombre a quelconque composé de 
chiffres dont la somme est S ; par exemple a = 546 et 
S = 5 + 4 + 6=15. On démontre (et nous l’admettrons 
ici) que a = S (mod 9), c’est-à-dire que si l’on divise a 
par 9, on obtiendra le même reste qu’en divisant S par 
9. Avec notre exemple, le reste de la division de 15 par 9 
est 6, donc le reste de la division de 546 par 9 sera 6 
(vérification aisée). 

• 2 - Dans la mesure où une division n’est autre 
qu’une suite de soustractions, on peut « éliminer les 
9 » dans la somme S de la manière suivante : 

S = 5 + 4 + 6 

reste de la division de S par 9 
9 = reste de la division de a par 9. 

(éliminé) 

3 - On peut s’exprimer autrement et dire : a 
appartient à la classe résiduelle 6. 

Soit un second nombre a'= 241, pour lequel 
S' = 2 + 4 + 1 = 7. La division de 7 par 9 donne comme 
reste 7, par conséquent S' et a' appartiennent à la 
classe résiduelle T. Considérons alors le produit 
aa' = p ; soit P la somme des chiffres de p. La classe 
résiduelle (mod 9) de p et de P est la même ; elle est 
donnée par une table de multiplication des classes 
résiduelles (mod 9), à l’intersection de la ligne 6 et de la 
colonne 7. Voici cette table, qui peut être établie 
comme on l’a fait dans l’ensemble Z/2 et dans l’ensem¬ 
ble Z/6 : 

Table de multiplication des classes résiduelles 
modulo 9. 


x Ô 123456 78 


Ô 

Ô 

ô 

Ô 

Ô 

Ô 

Ü 

Ü 

Ô 

Ô 

1 

0 

1 

2 

3 

4 

5 

6 

7 

8 

2 

Ü 

2 

4 

6 

8 

T 

3 

5 

7 

3 

Ô 

3 

6 

Ô 

3 

6 

Ô 

3 

6 

4 

0 

4 

8 

3 

7 

2 

6 

1 

5 

5 

0 

5 

1 

6 

2 

7 

3 

8 

4 

6 

0 

6 

3 

0 

6 

3 

0 

6 

3 

7 
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7 

5 

3 

T 

8 

6 

4 

2 

8 

0 

8 

7 

6 

5 

4 

3 

2 
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LES RÉSIDUS QUADRATIQUES 

On voit, en lisant cette table, que : 

6x7 = 6, (47) 

c’est-à-dire que le reste de la division par 9 de P doit 
être égal à 6 si nous n’avons pas fait d’erreur dans 
notre multiplication. 

4 - Pour vérifier le résultat de l’opération 
241 x 546, on calculera d'onc P, en faisant la somme 
des chiffres du produit, en éliminant les 9, et l’on 
obtient immédiatement le reste en question. Si ce reste 
est différent de 6, notre opération est sûrement fausse ; 
s’il est égal à 6, elle a des chances d’être exacte (mais 
non pas toutes les chances). 

Avec notre exemple, supposons qu’on ait trouvé 
241 x546 = 131 585. Traçons une grande croix et 
notons, en haut, la classe résiduelle (mod 9) à laquelle 
appartient 241, soit 7, et en bas la classe résiduelle 
(mod 9) à laquelle appartient 546, soit 6 : 



_ Faisons ensuite le produit des classes résiduelles 
7x6, à l’aide <Je notre table de multiplication; on 
trouve 6. Inscrivons 6 sur la partie gauche de la croix : 



Il ne reste plus qu’à calculer P en éliminant les 9 pour 
avoir la classe résiduelle (mod 9) à laquelle il appar¬ 
tient. On trouve ici 5 qujon inscrit à la drojte de la 
croix ; on constate que 6 n’est pas égal à 5, ce qui 
prouve qu’on a fait une erreur dans la multiplication. Si 
l’on avait trouvé 6 on n’aurait pas été certain de 
l’exactitude de l’opération. Par exemple les nombres 
suivants appartiennent à la classe 6 : 

131 586, 131 568, 311 586, 

mais il n’y en a qu’un qui représente la réponse exacte, 
à savoir 131 586. 

5 - Si l’on examine la table de multiplication des 
classes résiduelles (mod 9), on constate que le produit 
de deux classes est obtenu en prenant le reste de la 
division par 9 de la somme des chiffres de ce produit. 
Par exempJe : 7 x 8 donne 7 x 8 = 56, avec 5 + 6=11 ; 
11 divisé par 9 donne 2, donc : 

7x8 = 2. (48) 

C’est ce procédé qu’on applique systématiquement 
quand on fait la preuve par 9. 

— Plus généralement, nous constatons qu’il est 
possible de définir, dans l’ensemble Z/p, deux opéra¬ 
tions sur les classes résiduelles qui les constituent, et 
que nous avons appelées addition et multiplication. On 
peut montrer, mais nous ne le ferons pas ici, que ces 
opérations ont les mêmes propriétés que l’addition et 
la multiplication des entiers (commutativité, associati¬ 
vité, distributivité). On peut donc calculer sur des 
classes d’équivalence comme on calculerait sur des 
entiers, ce qui nous autorise à appeler « nombres » les 
classes d’équivalence. Cette remarque est très impor¬ 
tante, car elle comporte en puissance la généralisation 
de la notion de nombre, qui a été une des grandes 
conquêtes du XIX e siècle mathématique. 

Les résidus quadratiques. 

La théorie des congruences conduit à introduire la 
notion de résidu quadratique (Eu 1er, Le Gendre, Gauss) 
qui débouche sur d’importantes propriétés de la théo¬ 
rie des nombres. 

• Généralités. Une congruence telle que 

a = b (mod p) (49) 

énonce simplement une relation entre les entiers 
connus a et b. Si l’un des membres de la congruence 
contient des quantités inconnues, que nous noterons 
x, y, ..., résoudre la congruence, c’est trouver les 
valeurs de ces quantités, ou plus précisément les 
classes de valeurs à laquelle elles appartiennent. Sup¬ 
posons que l’on pose : 

3 x = 1 (mod 5). (50) 

Résoudre (50) consiste à trouver un entier a tel que : 

x = a (mod 5). (51) 

Pour résoudre la congruence (50), on peut, dans le 
cas présent, procéder comme suit, le nombre x peut 
prendre les valeurs : 

x = 5 k = multiple de 5 ; 
x = 5 k + 1 = multiple de 5 + 1 ; 

< x = 5 k + 2 = multiple de 5 + 2 ; 

x = 5 k + 3 = multiple de 5 + 3 ; 

x = 5 k + 4 = multiple de 5 + 4 ; 


le nombre k étant un entier. La famille de valeurs 
x= 5 k s’écrit : 


x = 0 (mod 5) (53) 

(ce qui signifie : « x #=>st divisible par 5 ») ; la famille 
x = 5 k + 1 s’écrit : 

x = 1 (mod 5) ; (54) 

etc. Les restes (résidus) de la division de 3 xpar 5 sont 
alors donnés par le tableau suivant : 


X 

3 x 

Reste 

de la division 
de 3 x par 5 

5 k 

15 k 

0 

5 k +1 

15 Je + 3 

3 

5 k + 2 

15/C+ 6 = 15 /c + 5 + 1 

1 

5 k + 3 

15/C+ 9 = 15/c + 5 + 4 

4 

5k + 4 

15 /c + 12 = 15/C + 10 + 2 

2 


Reste de la division de 3 x par 5. 


La congruence (50) est donc vérifiée pour 
x = 5 k + 2, c’est-à-dire pour x = 2 (mod 5). Nous 
dirons que cette relation est la solution de la 
congruence (50), ou encore que la congruence donnée 
admet comme racine x = 2. 

Selon le degré auquel figure l’inconnue, la 
congruence considérée sera dite du premier, du deu¬ 
xième, ..., du n-ième degré. 


• Congruences du premier degré. Elles se pré¬ 
sentent sous la forme générale : 

ax= b (mod p). (55) 

On démontre que : 

1 - si a et b sont différents de 0, elle admet une 
solution x = a ; 

2 - si b est seul nul, x = 0 ; 

3 - si a est seul nul, la congruence n’a pas de 
solution ; 

4 - si a et b sont nuis en même temps, la 
congruence est vraie quel que soit x. 

• Résidus quadratiques. Un entier a est dit 
résidu quadratique d’un nombre p, a et p étant 
premiers entre eux, lorsque la congruence : 

x 2 = a (mod p) (56) 


peut être résolue. Les nombres autres que a, premiers 
avec p, sont dits non-résidus quadratiques (ou, s’il n’y 
a pas d’ambiguïté, non-résidus). 

Le Gendre a introduit le symbolisme suivant (1785) : 



= 1 signifie : « 


= — 1 signifie : 


a est un résidu quadratique de 
(57) 

« a est un non-résidu quadra¬ 


tique de p ». 


Si p est un nombre premier différent de 2, il possède 
(p—1)/2 résidus quadratiques. 

• Loi de réciprocité. Cette propriété a été 
démontrée partiellement en 1783 par Euler, et reformu¬ 
lée par Le Gendre en 1785 ; la démonstration générale 
a été donnée par Gauss, en 1795. Soit deux nombres 
premiers pet q ; s’ils sont tous deux de la forme 4 n + 3, 
alors : 



Si l’un au moins des deux nombres est de la forme 
4 n + 1, alors : 



Les deux formules (58) et (59) peuvent être résumées 
dans la formule unique : 

,6 °> 

Cette loi peut aussi se formuler ainsi : étant donné 
les deux congruences : 

x 2 = p (mod q) et y 2 = q (mod p), (61 ) 

si p = q = 3 (mod 4), une et une seule de ces 
congruences est soluble ; sinon elles sont ou toutes 
deux solubles ou toutes deux insolubles. 


• Les imaginaires de Galois. Une congruence 
de degré n, par rapport à un module p premier, a, au 
plus, n racines lorsque n est inférieur à p. En 1830, 
Galois eut l’idée d’introduire des nombres analogues à 
l’imaginaire i de l’algèbre, permettant de conférer à 
chaque congruence exactement n racines. Ces nom¬ 
bres sont appelés imaginaires de Galois. Cette notion, 
qui fut modifiée ultérieurement par Dedekind, a contri¬ 
bué à l’extension de la notion de nombre et à la 
généralisation des propriétés des congruences. 


Généralisation de la notion de nombre. 

Le problème. 

Au point où nous en sommes — c’est-à-dire, en gros, 
au point des connaissances vers 1830-1840 — nous 
avons atteint les résultats généraux suivants : 

— les entiers naturels (l’ensemble N) possèdent 
des propriétés très nombreuses, parmi lesquelles on 
doit citer : la divisibilité, l’existence et la répartition 
asymptotique des nombres premiers, le théorème fon¬ 
damental de l’arithmétique ; 

— les entiers relatifs (l’ensemble Z) possèdent 
les mêmes propriétés, plus une, qui est importante : le 
fait que tout entier relatif est doté d’un opposé (ce qui 
n’impose aucune limite à l’opération « soustraction ») ; 

— la théorie des congruences a montré qu’on 
pouvait opérer sur des classes d’équivalence dans Z 
(ou dans N) de la même façon que sur des entiers; et la 
notion de résidu quadratique, jointe à la loi de récipro¬ 
cité, permet de découvrir de nombreuses et nouvelles 
propriétés des entiers et surtout d’aborder avec fruit un 
certain nombre de généralisations. 
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Frontispice des Disquisitiones Arithmeticae de 
Gauss (1801), œuvre fondamentale en ce qui 
concerne la théorie des nombres au XIX e siècle. 


L’idée naïve qu’un entier est un symbole permettant 
de compter des objets passe alors au second plan et se 
trouve remplacée par l’idée plus abstraite qu’un entier 
est un être mathématique, noté par un symbole, sur 
lequel on peut faire deux opérations (addition et 
multiplication) donnant un entier de même nature et 
possédant des propriétés de divisibilité, primarité, etc. 
De sorte que les mathématiciens qui vont s’intéresser à 
la théorie des nombres (Gauss, Galois, Kummer, Rie- 
mann, Hamilton, Jacobi) vont chercher à définir des 
systèmes de nombres (nous dirions maintenant des 
ensembles) caractérisés par les propriétés de deux 
opérations nommées « addition » et « multiplication » 
et dans lesquelles les opérations complémentaires de 
celles-ci (soustraction et division) sont toujours possi¬ 
bles. Ainsi parviendra-t-on à découvrir la structure de 
ces ensembles qu’on nomme des corps dans le lan¬ 
gage de l’algèbre moderne (voir p. 43). 
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— Il faut noter que parallèlement et indépen¬ 
damment, l’analyse progresse et que les notions de 
nombres réels et de nombres complexes — très 
différentes de celle d’entiers — font l’objet d’une étude 
tout aussi exigeante et tout aussi généralisatrice. Bien 
que ces chapitres ne fassent pas partie, directement, 
de la théorie des nombres, nous en dirons quelques 
mots dans ce qui suit pour traiter du problème de la 
généralisation de la notion de nombre dans son 
ensemble, sans nous limiter à la simple généralisation 
de la notion de nombre entier. 


L'ensemble Q des nombres rationnels. 

• Difficulté de la division dans Z. Si nous consi¬ 
dérons l’ensemble Z des entiers relatifs, dont les 
éléments seront notés a, b, c, .... l’équation : 

a = bx (b/ 0) (1) 

n’est possible que si b est un diviseur de a. Dans ce 
cas, on aura la solution x = a/b, le reste de la division 
a par b étant nul. Dans tous les autres cas, il n’existe 
aucun entier relatif x vérifiant la relation (1). Par exem¬ 
ple il n’existe aucun x G Z tel que 3 x = 5, car 5 n’est 
pas divisible par 3, mais l’équation 3 x = 6 admet 
la racine x = 2, puisque 6 divisé par 3 donne 2. 
Nous représenterons symboliquement la racine de 
l’équation (1) — quand elle existe — par le couple 
(a, b), que nous écrirons a/b ou ab _1 . Ce couple n’a 
un sens dans Z que si b est un diviseur de a. Cette 
limitation est due aux propriétés de l’ensemble Z et, 
pour l’éliminer, il faut construire un autre ensemble de 
nombres, tout comme en construisant Z nous avions 
éliminé les limitations à la soustraction. 

• L’ensemble Q. Considérons maintenant 
l’ensemble produit Z x 2*, c’est-à-dire l’ensemble de 
tous les couples d’entiers relatifs (a, b), avec b / 0, a 
et b étant pris dans cet ordre. Définissons sur cet 
ensemble la relation d’équivalence suivante : 

(a, b)%(a',b') si, et seulement si, ab'= ba'. (2) 

Par exemple, les couples (6,2) et (-12,-4) sont 
équivalents selon cette relation, car : 

6 x (- 4) = 2 x (- 12) = (- 24). (3) 

De même, (1,2), (2,4), (3,6), (-1,-2), (-5,-10), ... 
sont des couples équivalents. Et ainsi de suite. 

Comme nous l’avons fait pour construire l’ensemble 
Z, représentons l’ensemble Z x Z* par un graphique, 
en notant bien que l’entier 0 ne fait pas partie de 
l’ensemble Z*. Chaque couple (a, b) de l’ensemble 
produit Z x Z* est représenté sur le graphique par un 
point noir ; notons en bleu les couples équivalents par 
exemple à (1,2) : ils forment une série de points alignés 
de part et d’autre de 0. Cet ensemble de points est 
l’image d’une classe d’équivalence qu’on désignera 
par (1,2). On voit qu’on obtient un autre couple de 
cette classe en multipliant 1 et 2 par un même entier 
relatif ; par exemple, si l’on prend le relatif x = — 7, le 
couple (-7,-14) est équivalent à (1,2). 

D’une manière générale, tout élément de Z x Z*, 
c’est-à-dire tout couple ordonné (a, b), avec b / O, est 
appelé une fraction algébrique ; on l’écrira : a/b. Le 
premier terme du couple s’appelle le numérateur de la 
fraction, le second terme son dénominateur. L’ensem¬ 
ble Q = Z x Z* s’appelle Vensemble des rationnels. 
Outre les fractions telles que 1/2, 3/4, etc., l’ensemble 
Q comprend aussi tous les entiers (positifs ou néga¬ 
tifs), puisqu’un entier quelconque x peut être mis sous 
la forme d’une fraction (par exemple, + 4 = 4/1 ou 8/2, 
ou 16/4, etc.). On démontre aisément que l’on peut 
définir sur l’ensemble Q les opérations d’addition et de 
multiplication, et que ces opérations possèdent les 
mêmes propriétés (commutativité, associativité, distri¬ 
butivité) que dans l’ensemble Z. L’élément neutre pour 
l’addition est le rationnel 0 (ou, si l’on veut, toute 
fraction dont le numérateur est nul) ; l’élément neutre 
pour la multiplication est le rationnel 1 (ou toute 
fraction dont le numérateur est égal au dénominateur). 

• Intérêt algébrique du corps Q. Considérons à 
nouveau l’équation (1) ci-dessus, mais supposons 
cette fois-ci que a et b soient des rationnels apparte¬ 
nant à l’ensemble Q. On peut toujours écrire : 

x = F = ab ' (4) 

L’impossibilité rencontrée dans Z n’existe plus ici. 
Ainsi, la division de 3 par 4 est impossible dans Z, car 4 
n’est pas un diviseur de 3 ; dans G> elle fournit comme 
quotient le rationnel q = 3/4. 

• Notion d’inverse. A tout nombre entier a G Z, 
différent de 0, correspond une fraction (1, a) = a -1 , 
qu’on appelle l’inverse de a. 

Voir p. 138 les règles de calcul sur les fractions. 


L'ENSEMBLE C DES RATIONNELS ET L'ENSEMBLE [R DES RÉELS 


Construction du corps 

Q = Z x Z*. 

Les points noirs représentent 
les éléments (couple a/b) de 
Z x Z*. Les points gris sur 
l’axe vertical représentent les 
éléments équivalents à (0,1), 
(0,2), etc., qui sont des élé¬ 
ments nuis (la fraction a/b est 
nulle si, et seulement si, 
a = 0). Les points bleu foncé 
représentent des éléments 
(couple a/b) équivalents à la 
fraction (1/2) ; les points bleu 
clair représentent les couples 
équivalents à la fraction (1/1), 
qui est l’unité (élément neutre 
pour la multiplication). Il n’v a 
pas de couple (a, b) repré¬ 
senté sur l’axe horizontal, car 
les points de cet axe sont les 
images de (a, 0) et l’on a sup¬ 
posé b¥ 0 en posant b G Z*. 


les points bleus de cette droite 
sont ies images de couples (a/b) équivalents à (1 /2) 



L'ensemble U des réels. 

La définition des nombres réels relève de l’analyse 
(voir p. 52). Nous ferons toutefois à leur sujet quelques 
remarques indispensables à ce stade de notre exposé. 

• Les nombres irrationnels. En généralisant la 
notion d’entier de l’ensemble N à l’ensemble Z, nous 
avons rendu possible la soustraction x-y quels que 
soient les entiers x et y concernés. En passant de 
l’ensemble Z à l’ensemble Q, nous avons rendu possi¬ 
ble la division x/y quels que soient les entiers concer¬ 
nés (à condition que y / 0). Les nombres constituant 
l’ensemble Q — entiers ou fractionnaires — sont dits 
rationnels et permettent de résoudre toutes les équa¬ 
tions du premier degré dont la forme générale est 
ax+b = 0, qui, si l’on se place dans l’ensemble <0, 
admet toujours une racine x = - b/a (si a / 0). En 
revanche, dans l’ensemble Z, l’existence de la racine x 
est liée à la condition : a est un diviseur de b. 

Toutefois, l’ensemble <0 des rationnels possède lui 
aussi ses frontières. Ainsi il est impossible de trouver, 
dans cet ensemble, une réponse à la question sui¬ 
vante : « Quel est le nombre x qui mesure la diagonale 
d’un carré de côté égal à l’unité ? ». En effet ce , 
problème impose d’écrire (théorème de Pythagore) 
x 2 = 2, et il n’existe aucun x G Q — c’est-à-dire aucune 
fraction rationnelle — qui, multiplié par lui-même, 
donne 2. Pour passer outre, il nous faut encore élargir 
l’ensemble Q. 

Si nous convenons d’appeler « racine de 2 » l’être 
mathématique qui, multiplié par lui-même donne 2, et 
si nous le notons, sans référence à son signe, V2, on 
aura, en vertu de cette convention et en respectant la 
règle des signes : 

(-V2)x(-V2) = 2; (5) 

(+ V2) x (+ V2) = 2 . 

Les nombres tels que V2 sont dits irrationnels : on 
entend par là qu’ils n’appartiennent pas à l’ensem¬ 
ble Q. Nous étudierons plus loin leur définition (voir 
p. 53). Dès maintenant nous pouvons préciser que l’on 
calcule sur les irrationnels selon des lois analogues à 
celles qui régissent le calcul sur les rationnels. On 
aura, par exemple : \ r ~à + vHb = VH5 4- V~à ; etc. 
Retenons, au passage, les règles suivantes (connues 
depuis l’Antiquité) : 

VâVb = Vab; (6) 



(Ces règles sont des cas particuliers du calcul expo¬ 
nentiel, résumé p. 139.) 

• L 'ensemble R des réels est constitué par 
l’ensemble <Q des rationnels et par l’ensemble des 
irrationnels (qui ne comporte pas de symbole particu¬ 
lier). Sa définition a soulevé de nombreux problèmes 
techniques évoqués p. 52. Nous noterons que les 


nombres réels peuvent être répartis en nombres 
algébriques et nombres transcendants. 

— La théorie des équations est du ressort de 
l’algèbre ; mais il nous faut y faire allusion ici pour 
comprendre la répartition des réels. Un type particuliè¬ 
rement important d’équation est représenté par les 
équations dites polynomiales, de la forme : 

a 0 x n + a 1 X "” 1 + a 2 x n ~ 2 + ••• + a n _ 1 x+ a n = 0 , (8) 
les coefficients a 0 , a 1f a 2 , ..., a n étant des réels ration¬ 
nels. 

On montre en algèbre qu’une telle équation possède 
toujours n racines, c’est-à-dire qu’il y a n valeurs de x 
qui vérifient l’équation (8). Comme nous le verrons 
p. 70, toutes ces racines ne sont pas obligatoirement 
réelles. Tous les nombres — réels ou non réels, c’est- 
à-dire appartenant à IR ou à un autre ensemble que IR 
— qui peuvent être racines d’une équation du n-ième 
degré à coefficients rationnels sont dits algébriques. 

— Vers 1844, J. Liouville a montré qu’il existait 
des nombres qui ne pouvaient pas être racine d’une 
équation entière à coefficients rationnels telle que (8), 
et il les a baptisés nombres transcendants. Par exem¬ 
ple le nombre -tt, introduit par Archimède dans l’étude 
du cercle et des corps ronds, est un nombre transcen¬ 
dant : jamais une équation telle que (8) n’admettra une 
solution x = TT. L’ensemble des nombres transcen¬ 
dants est infini, mais nous en retiendrons deux, qui 
jouent un rôle de premier plan en mathématiques : le 
nombre tt, déjà cité, dont la valeur approchée est : 

tt = 3,141 592 654..., (9) 

et le nombre e qui sert notamment à définir les 
logarithmes népériens et dont la valeur approchée est : 

e = 2,718 281 828... (10) 

La transcendance de tt a été démontrée en 1882 par 
Lindemann et celle du nombre e par Hermite, en 1872. 

Nous pouvons résumer la répartition des réels à 
l’aide du schéma ci-dessous. 


L’ensemble U des réels. 

Bien noter que tous les nombres transcendants sont 
irrationnels, mais que les irrationnels contiennent 
d’autres nombres que les nombres transcendants. 


nombres 

nombres algébriques transcendants 



naturels 


IL - entiers 


Q = rationnels irrationnels 


R = réels 
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L'ENSEMBLE C DES COMPLEXES 


L'ensemble C des complexes et les nombres 
hypercomplexes. 

• Le nombre i. Une équation telle que x 2 - 1 = 0 
admet deux racines réelles x' = - 1 et x" = + 1 : elle est 
en effet équiValente à x 2 = 1, et le réel 1 (unité) a deux 
racines carrées, qui sont ±1. Mais que dire, par 
ailleurs, de l’équation : 

x 2 + 1 = 0 ? (il) 

Elle est équivalente à x 2 = - 1, et il n’existe aucun 
nombre réel dont le carré soit négatif : l’équation (11) 
n’a pas de racine dans U. 

Pour construire un ensemble dans lequel 
l’équation (11) aurait une racine, introduisons le sym¬ 
bole i, avec la convention : 

i 2 = -1. (12) 

Dès lors, l’équation (11) s’écrit aussi x 2 = i 2 , et admet 
les deux racines + i et - i, qu’on appelle des unités 
imaginaires. Un réel tel que - 9 s’écrit alors 9 i 2 , et 
possède deux racines imaginaires + 3 i et - 3 i (on 
écrit : ± 3 i, qui se lit « plus ou moins 3 i »). 

• Les nombres complexes , dont la théorie a été 
faite par Gauss, sont des nombres de la forme : 

z = a + bi, (13) 

a et b étant des réels. Leur ensemble, dans lequel on 
définit l’addition et la multiplication, est désigné par le 
symbole C. Si b = 0, on a z = a, et le nombre est réel ; 
si a = 0, on a z = bi, et le nombre est dit imaginaire 
pur. Les nombres réels sont donc des nombres 
complexes particuliers (cas a = 0). La construction de 
l’ensemble des complexes et les propriétés de cet 
ensemble sont étudiées p. 55. 

• Généralisation. La généralisation de la notion 
de nombre peut se poursuivre au-delà de l’ensemble 
des complexes. Nous verrons, en algèbre, qu’on peut 
construire des ensembles d’êtres mathématiques 
appelés nombres hypercomplexes et sur lesquels on 
peut calculer. L’étude des nombres hypercomplexes 
est une branche très importante de l’algèbre, l’ algèbre 
linéaire (voir p. 58). 

Généralisation de la notion d'entier. 

Nous connaissons déjà les entiers naturels (l’ensem¬ 
ble N) et les entiers relatifs (l’ensemble Z), qui appar¬ 
tiennent tous deux à l’ensemble des réels. Nous allons 
voir qu’il est possible de définir d’autres catégories 
d’entiers, qui ont en commun avec les entiers 
« ordinaires » les propriétés de divisibilité, primarité, 
etc. L’intérêt de cette généralisation est double : 1° elle 
élargit le champ des réflexions mathématiques ; 2° elle 
permet de vérifier la généralité des théorèmes de 
l’arithmétique. 

• Les entiers complexes ont été étudiés par 
Gauss. Ce sont des complexes de la forme a + bi, dans 
lesquels a et b sont des entiers relatifs (et non des réels 
quelconques, comme dans le cas des nombres 
complexes). 

— On appelle norme d’un nombre complexe 
a + bi le nombre réel a 2 + b 2 ; quand a et b sont des 
entiers, la norme a 2 + b 2 est elle-même un entier 
appartenant à Z. Tout entier complexe tel que 
a 2 + b 2 = 1 est appelé unité complexe. C’est le cas 
pour les nombres ±1 et ± i. Démontrons-le pour le 
nombre — 1 par exemple : on peut écrire — 1 = a + bi, 
avec a = — 1 et b = 0 ; d’où a 2 + b 2 = 1. 

— Un entier complexe a + bi est divisible par un 
autre entier complexe c + d i si, et seulement si, les 
nombres ac + bd et bc — ad sont divisibles par la 
norme c 2 + d 2 du diviseur. Cette importante propriété 
se démontre aisément de la manière suivante. 

Si a + bi est divisible par c + d i, il existe un entier 
complexe x + iy tel que : 


(a + bi) = (x + iy) (c + d i). 

(14) 

En effectuant les calculs, on trouve : 


a + bi 

= (ex - dy) + (dx+ cy) i. 

(15) 

D’où le système 

j ex - dy = a ; 

(16) 


\ dx + cy = b . 

Ce système admet pour solution : 

f ac + bd 

x = — 2 —itt ; 
c+d 

(17) 

i 

| bc - ad 

y = ^2^ .2• 

- c + d 


Pour que le nombre x + iysoit un entier complexe, il 
faut et il suffit que xet y soient des entiers, donc que 
ac+ bd et bc - ad soient divisibles par c 2 + d 2 , ce qui 
démontre la proposition. 

— Tout entier complexe qui n’admet pas d’autre 
diviseur que lui-même ou les unités complexes ± i est 
un nombre premier complexe. On montre en outre que 
les quatre nombres 1 + i, 1 - i, i - 1 et - 1 - i sont 
premiers comolexes. 

• Entiers algébriques. Un nombre 0 — réel ou 
complexe — est appelé entier algébrique s’il est racine 
de l’équation : 

x"+ a, x n_1 + + a n _-, x + a„ = 0 , (18) 

dans laquelle les coefficients a 1t a 2 , ..., a n sont des 
entiers : l’équation (18) est donc une forme particu¬ 
lière de l’équation (8) ci-dessus, dans le cas où a 0 = 1 
et où les coefficients sont des entiers et non des 
rationnels quelconques. D’une manière générale, 
l’ensemble des entiers algébriques est composé de 
tous les nombres de la forme : 

b 0 + bi 6+ b 2 6 2 + ••• + b r 6 r , (19) 

b 0 , b 1t ..., b„ étant des coefficients rationnels et 0 une 
racine de l’équation (18). On peut démontrer que la 
somme, la différence et le produit de deux entiers 
algébriques sont des entiers algébriques ; on peut 
définir sur l’ensemble des entiers algébriques les 
caractères de divisibilité, la notion de nombre premier 
algébrique, etc. 

• Idéaux de Kummer. Kummer a montré (1847) 
que le théorème fondamental de l’arithmétique (unicité 
de la décomposition en facteurs premiers) ne s’appli¬ 
quait pas à l’ensemble des entiers algébriques. Toute¬ 
fois, la propriété peut être établie si l’on adjoint à cet 
ensemble un autre ensemble dont les éléments sont 
appelés des idéaux. Voici brièvement l’essentiel de la 
théorie. 

Soit {a, b,..., s, t} l’ensemble des entiers algébri¬ 
ques. Si a = bc, c’est-à-dire si a est divisible par b, 
alors l’ensemble des multiples sa de a est inclus dans 
l’ensemble des multiples sb de b : à la notion de 
divisibilité, on peut donc substituer la notion d’inclu¬ 
sion d’un ensemble dans un autre. Cela dit, l’ensemble 
des multiples sa de a est appelé idéal ou idéal princi¬ 
pal et peut être noté a. Les êtres mathématiques tels 
que a peuvent faire l’objet de calculs, à l’instar des 
entiers en général. En particulier on peut définir la 
divisibilité d’un idéal par un autre et la notion d’idéal 
premier. Enfin on démontre, à propos des idéaux de 
Kummer, le théorème fondamental de l’arithmétique : 
tout idéal non premier peut être représenté par un 
produit de facteurs idéaux premiers et cette décompo¬ 
sition est unique. 

• Résumé. Dans ce qui précède, nous avons 
rencontré des ensembles dont les éléments sont appe¬ 
lés des nombres, et qui peuvent être construits de 
proche en proche à partir de l’ensemble N* des entiers 
naturels. Les règles de calcul dans ces ensembles sont 
analogues aux règles de l’arithmétique élémentaire et 
concernent deux opérations fondamentales : l’addition 
et la multiplication, auxquelles on associe les opéra¬ 
tions « inverses », la soustraction et la division. L’élar¬ 
gissement de la notion de nombre rend possible toutes 
les opérations. Voici la liste de ces ensembles. 

N* : entiers naturels. 

N : entiers naturels +0. 

Z : entiers relatifs. 

Q : nombres rationnels. 

IR : nombres réels. 

C : nombres complexes. 

Z/n : classes résiduelles modulo n. 

L’introduction, avec Z, des nombres négatifs, peut 
conduire à distinguer les entiers positifs Z + et les 
entiers négatifs Z" ; de même on distingue les ration¬ 
nels positifs Q + des rationnels négatifs <QT et les réels 
positifs IR + des réels négatifs IR". 

• De l’arithmétique à l’algèbre. Les propriétés 
des ensembles N, Z, etc. proviennent de ce qu’on 
nomme leur structure , c’est-à-dire de caractéristiques 
très générales qui peuvent être exprimées par un petit 
nombre d’axiomes. A partir des travaux de Lagrange, 
Gauss et Galois, les mathématiciens du XIX e siècle ont 
élaboré une algèbre des structures qui se trouve au 
confluent de la théorie des nombres, de l’algèbre 
classique, de la géométrie, de la topologie et de 
l’analyse. C’est sur cette algèbre des structures que 
repose une bonne partie — sinon la totalité — des 
mathématiques dites « modernes ». 


Problèmes classiques 
de la théorie des nombres. 

La représentation d'un nombre par une forme 
quadratique. 

On appelle forme quadratique un polynôme (voir la 
définition p. 66), dont les termes sont tous du deuxième 
degré. Ainsi x 2 — y 2 est une forme quadratique à 
deux indéterminées, x et y ; 3 x 2 - 5 xy + z 2 est une 
forme quadratique à trois indéterminées x, y et z (le 
terme en xy est du deuxième degré : c’est le produit de 
deux termes du premier degré). Nous allons nous 
intéresser ici aux formes quadratiques binaires, c’est- 
à-dire à deux indéterminées, de la forme : 

f = ax 2 + bxy + cy 2 . (1 ) 

La forme quadratique f est dite réelle ou complexe 
selon que les coefficients a, b, c sont eux-mêmes réels 
ou complexes. 

S’il existe deux entiers, u et v non tous deux nuis, 
tels que l’entier m soit égal à : 

m = au 2 + buv + cv 2 , (2) 

on dit que l’entier m est représenté par la forme 
quadratique f ; si, de plus, u et v sont premiers entre 
eux, la représentation est dite primitive. 

L’étude d’une forme quadratique conduit à calculer 
deux grandeurs fonction des coefficients et qu’on 
nomme le déterminant D et le discriminant A, définis 
par : 

piq _ b 2 

D =---; A = — 4 D = b 2 — 4 ac . (3) 

(Tous les collégiens reconnaissent dans A le fameux 
discriminant de l’équation du second degré.) Nous 
supposerons dans ce qui suit que a, b et c sont réels. 

1 - Si A < 0 et a ^ 0, f représente un entier du 
signe de a ; la forme quadratique est dite définie et si a 
est positif, elle est dite définie positive. 

2 - Si A > 0, f représente à la fois les nombres 
positifs ou négatifs ; la forme quadratique est dite 
indéfinie. 

On montre qu’une forme quadratique f est équiva¬ 
lente à toute forme f obtenue en remplaçant x et y par 
des indéterminées x' et y' telles que : 

x = olx' + /3y' ; y = yx' + 8y' . (4) 

Les nouvelles grandeurs indéterminées sont reliées 
aux anciennes par des relations linéaires, c’est-à-dire, 
du premier degré : on dit qu’on a appliqué à f une 
transformation linéaire. Les formes quadratiques équi¬ 
valentes à une forme donnée constitue une classe, 
caractérisée par une forme F : 

F = Ax 2 + Bxy + Cy 2 , (5) 

appelée forme réduite de la classe considérée. Les 
coefficients A, B, C de la forme F vérifient les rela¬ 
tions : 

-A<B^A^C, avec B^O, si C = A. (6) 

Le problème de la représentation d’un entier par une 
forme quadratique a été étudié par Gauss (1801), 
Eisenstein (1847), H. Minkowski (1884), H. D. Klooster- 
man et V. Tartakovskij (1924), C. L. Siegel (1936), B. W. 
Jones et G. Pall (1944), L. E. Dickson, Hasse, etc. 

Le problème de Waring (1770). 

E. Waring a énoncé la conjecture suivante : tout 
entier positif est la somme au plus de neuf cubes 
(entiers, positifs) ou de dix-neuf puissances quatriè¬ 
mes ou de trente-cinq puissances cinquièmes, et, plus 
généralement, d’au plus g puissances k-ièmes, g étant 
une fonction de k. Ce problème a été étudié notam¬ 
ment par Hardy, Littlewood, et Ramanujan (1917), puis 
par I. M. Vinogradov, L. E. Dickson et de nombreux 
mathématiciens. La conjecture de Waring a été démon¬ 
trée dans un très grand nombre de cas, et les différen¬ 
tes recherches qu’elle a engendrées ont donné nais¬ 
sance à diverses méthodes d’analyse des nombres. 

Le problème de Goldbach (1742). 

C. Goldbach a énoncé la conjecture suivante : tout 
entier est la somme de trois nombres premiers, tout 
entier pair est la somme de deux nombres premiers. 

Cette conjecture est restée sans démonstration 
jusqu’en 1930. A partir de cette époque, on a montré 
que tout entier positif suffisamment grand était la 
somme d’au plus 800 000 nombres premiers (L. Sni- 
rel’man, 1930), puis d’au plus 2 808 nombres premiers 
(N. P. Romanov, 1935), d’au plus 71 nombres premiers 
(Heilbronn et Landau, 1936), d’au plus 67 nombres 
premiers (Ricci, 1937). C’est Vinogradov qui adonné, 
en 1937, la démonstration de la conjecture de Gold¬ 
bach. 
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ANALYSE COMBINATOIRE. 


Avant d’aborder la théorie des structures algébriques 
et l’algèbre en général, il nous faut consacrer quelques 
lignes à une branche des mathématiques reliée à la 
théorie des nombres, mais aussi à d’autres domaines 
importants des mathématiques, comme le calcul des 
probabilités, la théorie des groupes, la topologie, etc., 
et qu’on nomme l 'analyse combinatoire. 


Coup d'œil historique. 

Les premières recherches d’analyse combinatoire 
concernent les nombres figuré é : elles ont été le fait 
des Pythagoriciens et de Diophante d’Alexandrie. Dans 
les temps modernes, la question a été reprise, en 
liaison avec l’étude des combinaisons p à p de n 
objets, la théorie des nombres et l’analyse par Fermât 
(1621), Lagrange, Euler et Gauss. 

A la fin du XVII e siècle, les exigences du calcul 
différentiel naissant ont mis en valeur le problème du 
binôme de Newton (voir ci-dessous), dont la formule 
était connue des mathématiciens chinois du XIV e 
siècle, et qui a été énoncée par Stifel (1543), Pascal 
(1665), Leibniz (1676), Newton (1676). La série consti¬ 
tuée par le binôme a été étudiée par J. Wallis et 
Jacques Bernoulli (1713). 

Au début du XVIII e siècle, J. Bernoulli — créateur 
avec Pascal du calcul des probabilités — étudie les 
permutations, les arrangements et les combinaisons. 
Puis la théorie des équations conduit les mathémati¬ 
ciens à examiner les fonctions symétriques des raci¬ 
nes, question timidement abordée par A. Girard en 
1629 et développée par A. de Moivre (1698), Newton 
(1707), Waring (1762), Lagrange (1770); elle sera 
reprise par Galois au XIX e siècle. La théorie des déter¬ 
minants remonte à Leibniz (1690), mais elle a été 
principalement développée par Cramer (1750), 
Lagrange, Gauss et Cauchy (1815). 

Enfin, au XIX e siècle, sont apparus les problèmes de 
partition des nombres (Ferrers, 1853 ; Sylvester, 1882). 


Le triangle arithmétique de Pascal (1654). 

En étudiant l’algèbre élémentaire les formules don¬ 
nant le développement de (a + b) 2 et (a + b) 3 : 

(a + b) 2 = a 2 + 2 ab + b 2 . (1) 

(a + b) 3 = a 3 + 3 a 2 b + 3 ab 2 + b 3 . (2) 

L’examen de ces deux formules montre que les 
termes littéraux du développement de (a 4- b) 2 sont 
tous du second degré (a 2 , ab, b 2 ), et ceux du 
développement de (a + b) 3 du troisième degré 
(a 3 , a 2 b, ab 2 , b 3 ). Les coefficients numériques sont : 

12 1 pour (a + b) 2 , (3) 

13 3 1 pour (a + b) 3 . (4) 

On peut montrer que le développement de (a + b) n 
ne comprend que des termes littéraux du n-ième degré 
(a n , a n_1 b, a n ~ 2 b 2 ,..., ab n ~\ b n ), et que les coefficients 
de ce développement sont donnés par une construc¬ 
tion appelée triangle de Pascal et découverte, en fait, 
par l’Allemand Stifel en 1543. On peut en effet ranger 
les coefficients de ( a + b) n triangulairement, comme 
on l’a fait ci-après : 

1 

11 <— 1 ère ligne 

12 1 <-2 e ligne 

13 3 1 

1 4 6 4 1 

1 5 10 10 5 1 

1 6 15 20 15 6 1. ^6 e ligne 

V etc. etc. M n-ième ligne 

La construction est simple. Le sommet du triangle 
porte le nombre 1, qui est répété au début et à la fin de 
chaque ligne de nombres. La première ligne contient 
les deux nombres 1 et 1 ; chaque nombre autre que 1 
est la somme des deux nombres sous lesquels et entre 
lesquels il est placé. Ainsi le 2 de la 2 e ligne est égal à 
1 4-1 ; le premier 3 de la 3 e ligne est la somme 1 + 2 ; 
etc. Nous avons arrêté le triangle à la 6 e ligne, mais on 
peut évidemment le continuer indéfiniment. La 7 e ligne 
commencée par 1, qui serait suivie de 1+6 = 7, 
6 + 15 = 21, etc., jusqu’au 1 final. On aurait donc: 

7 e ligne : 1 7 21 35 35 21 7 1 . 

On constate que la 2 e ligne (1,2,1) donne les coeffi¬ 
cients du développement de (a + b) 2 ; la troisième 
ligne (1,3, 3,1 ) donne le développement de (a + b) 3 ; il 
en est de même pour les lignes suivantes. Ainsi (a + b) 6 


TRIANGLE DE PASCAL ET FORMULE DU BINÔME 



Le << triangle de Pascal » devrait être appelé, en fait, le « triangle de Stifel », car c'est dans /’Arithmetica 
integra, publiée en 1543 par. ce savant allemand, que se trouvent étudiées les propriétés de cette figure, 
identique à celle que Pascal a tracée dans son Traité du triangle arithmétique, un siècle plus tard (vers 1654), 
pour résoudre certains problèmes en rapport avec le calcul des probabilités. 


a pour coefficients (1,6,15,20,15,6,1). Comme tous 
les termes littéraux de ce développement doivent être 
du 6 e degré, on aura donc : 

(a + b) 6 = a 6 + 6 a 5 b + 15 a 4 b 2 + 20 a 3 b 3 

+ 15*a 2 ô 4 + 6 ab 5 + b 6 . (5) 


approximation de n ! en utilisant la formule de Stirling 
(1730) : 

n ! =(j) V2irn(1 + e), (4) 

e désignant une quantité aussi petite que l’on veut. On 
en tire : 


Fonction factorielle n 
et formule du binôme. 



(5) 


Fonction factorielle n(n !). 

Si n est un entier naturel, n > 1, la fonction facto¬ 
rielle n, notée n !, est le produit des n premiers entiers 
naturels. 

n ! = 1 x 2 x 3 x 4 x ••• x (n - 1) x n. (1) 

Le point d’exclamation utilisé pour noter cette fonc¬ 
tion exprime (sans doute) sa croissance rapide. On a en 
effet : 

f 2! = 1 x 2 = 2 ; 

31=1x2x3=6; 

41 = 1x2x3x4 = 24; (2) 

< 51 = 1x2x3x4x5 = 120; 

etc. 

10 ! = 1x2x3x4x5x6x7x8x9x10 
L =3 628 800. 

On notera, à propos de cette fonction, les points 
suivants. 

1 - Pour tout n> 1, on a la relation de récur¬ 
rence : 

(n + 1) ! = (n + 1) (n !). (3) 

2 - En conséquence on doit poser 1 ! = 1 et 
0 ! = 1 . 

3 - Quand n est très grand, on peut donner une 


e étant la base des logarithmes népériens (voir 
p. 31). Par exemple, pour n = 50, en prenant e = 
2,718 281 828, on a n/e = 18,393 972 06, et (n/e) n « 
1,713 1 x 10 63 , d’où : 

50 ! » 1,713 1 x 10 63 x 17,724 54 = 30,364 x 10 63 , (6) 

soit un nombre de 65 chiffres ! 


Le binôme de Newton. 


Considérons une expression algébrique de la forme 
x+a, dans laquelle x et a sont des nombres réels ; a 
est un coefficient, x est une indéterminée. Une telle 
expression est appelée un binôme du premier degré. 
Nous allons nous poser la question suivante : dévelop¬ 
per la puissance n-ième du binôme, à savoir (x+ a) n . 

Ce développement peut se faire en utilisant le trian¬ 
gle arithmétique de Pascal. Si le binôme est de la forme 
(x-a), le développement de (x— a) n se fait de la 
même façon, à la condition de remplacer le signe « + » 
par le signe « — » devant les termes où a est à une 
puissance impaire. 

On peut aussi montrer que le coefficient de rang p a 
pour valeur le nombre de combinaisons de n objets 
pris p à p comme on l’explique ci-après (p. 34); ce 


nombre s’écrit symboliquement CR ou 



. La for- 
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mule du binôme s’écrit alors : 

(x 4- a ) n = x" + 


ax + 

+ 


en utilisant la formule donnant 


n 
2 

a w x 
n 


+ v • a 


(7) 


(voir ci-dessous, 


D, c), le développement du binôme s’écrit donc : 

(x + a ) n = x n 4- nax r 


i n (n - 1) 2 . 

+ — - . — a x 


2 ! 

-p + 1 > a p x > 
p '■ 


+ ■■■ + a 


( 8 ) 


Dans le cas où n = 6 , par exemple, on aura : 

(x +a) e = x e + 6ax B + ~a 2 x“ 

6 x 5 x 4 3 3 6 x 5 x 4 x 3 4 P 

+-—-a x +-—-a 4 x 2 


3! 


4 ! 

6x5x4x3x2 . f 

+-57-a x + a 


(9) 


On constatera que les coefficients 1 , 6 , 6 x 5/2 !, ... 
sont respectivement égaux à (1, 6 , 15, 20, 15, 6 , 1), 
c’est-à-dire aux nombres de la sixième ligne du trian¬ 
gle de Pascal. 


Permutations , arrangements , 
combinaisons. 


Permutations. 

Considérons l’ensemble (a, b, c}. Si nous tenons 
compte de Vordre dans lequel les éléments sont 
rangés, l’ensemble {a, b, c} est différent de l’ensem¬ 
ble {a, c, b} par exemple. Tous les joueurs de 
« tiercé » connaissent la différence qui existe entre un 
tiercé « dans l’ordre » et un tiercé « dans le désordre ». 
L’opération par laquelle on intervertit les éléments d’un 
ensemble s’appelle une substitution ; son résultat, à 
savoir {a, b, c}, {a, c, b}, etc. est une permutation. 
La question que nous posons est la suivante : combien 
y-a-t-il de permutations possibles dans un ensemble de 
n éléments ? 

Appelons P n ce nombre et prenons d’abord le cas où 
n = 2 . Alors il n’est pas besoin d’être grand clerc pour 
trouver que 

^2 = 2 . ( 1 ) 

Le cas n = 3 est connu, comme nous le disions, de 
tous les joueurs de tiercé. Il y a six ordres différents 
possibles pour 3 éléments (3 chevaux par exemple). 
Appelons a, b, et c les trois éléments, on a les six 
permutations suivantes : 

abc bca cab 
acb bac cba. 

Nous écrirons donc 

Ps = 6 . (2) 

Nous allons établir la formule donnant P n , en utili¬ 
sant la notion d’application bijective d’un ensemble 
dans un autre. 

Appelons E = { a, b, c,... k} l’ensemble de n élé¬ 
ments permutables et considérons l’ensemble fini 
d’entiers naturels F = {1,2, 3,..., n }. Une permutation 
particulière de E est définie en donnant un « numéro 
d’ordre» à chaque objet {a, b, c ... k}, ce numéro 
d’ordre étant compris entre 1 et n. Par exemple on 
donne le numéro 1 à l’élément c, le numéro 2 à l’élé¬ 
ment a, le numéro 3 à l’élément k, et ainsi de suite 
jusqu’à ce que les n objets aient tous un numéro 
distinct, chaque numéro étant un élément de l’ensem¬ 
ble F Cela revient à dire qu’on a réalisé une applica¬ 
tion bijective de E dans F. 

Il y a évidemment n façons de choisir l’élément de E 
qui s’applique sur 1. Ce choix fait, il reste (n-1) 
éléments que l’on peut appliquer sur 2 , donc (n- 1 ) 
choix possibles. Ce choix fait, il y a (n-2) façons de 
choisir l’élément appliqué sur 3 ; et ainsi de suite, 
jusqu’à ce qu’il ne reste plus qu’un seul élément de E 
non pourvu d’un numéro d’ordre, et qu’on applique sur 
n, dernier nombre de l’ensemble F. Le nombre total 
d’applications bijectives, c’est-à-dire de permutations 
est donc : 

P n = n(n - 1) (n - 2) — x 3 x 2 x 1 = n ! (3) 

Comme on l’a dit précédemment, la fonction n ! croît 
très rapidement. Le nombre de permutations de n ob¬ 
jets est donc rapidement très grand. Donnons un 
exemple concret pour illustrer ce fait. Imaginons qu’un 
joueur invétéré, que nous nommerons pour faciliter 
notre récit « Champion », participe à un concours 


publicitaire dans lequel on lui demande de classer par 
ordre de préférence 10 vedettes de l’actualité. Cham¬ 
pion, pour être certain de gagner, décide de dresser 
autant de listes qu’il y a de rangements possibles de 
ces 10 vedettes, et il se met — avec une grande 
imprévoyance — au travail. En effet, il s’engage dans 
une affaire dont il ignore l’ampleur : il existe 
P 10 = 10 ! = 3 628 800 permutations possibles des dix 
noms de vedettes et, en supposant qu’il mette une 
demi-minute pour dresser une liste, Champion devra 
écrire sans s’arrêter un seul instant pendant 
1 263 jours 11 heures 20 minutes avant d’arriver au 
bout de sa tâche. Il sera mort de faim et d’épuisement 
avant d’en avoir terminé. 

Arrangements. 

Rendons-nous sur un terrain de courses hippiques, 
un jour de Grand Prix. Au départ : 20 chevaux, que 
nous désignerons, comme les turfistes, par des numé¬ 
ros. Ils constituent E = {1,2,3.20}. Champion, 

notre joueur de tout à l’heure, vient nous consulter 
pour nous demander combien il peut jouer, en tout, de 
tiercés pour être certain de gagner « dans l’ordre ». 
Cette notion d’ordre impose de considérer, par exem¬ 
ple, le tiercé {1,2,3} comme différent du tiercé 
{2,1,3}. Traduisons dans le langage des mathémati¬ 
ciens : il s’agit de déterminer de combien de façons on 
peut ranger 20 objets trois à trois, en considérant que 
deux rangements comportant les mêmes éléments, 
mais dans un ordre différent, sont des rangements 
distincts : on dit aussi, quand on tient compte de 
l’ordre, qu’il s’agit d 'arrangements. Nous désignerons 
le nombre d’arrangements par A p (lire : « A, p dans 
n »), avec, ici, n = 20 et p = 3. 

Raisonnons comme pour les permutations. Se don¬ 
ner un arrangement de trois objets dans l’ensemble E 
(on dit aussi : un arrangement d’ordre 3), c’est faire 
correspondre à chacun des nombres de l’ensemble 
{1,2,3} un élément de E (remarquons, au passage, 
qu’il ne s’agit pas d’une bijection, comme dans le cas 
des permutations, mais d’une injection). L’image de 1 
peut être choisie parmi les vingt chevaux ; ce choix fait, 
l’image de 2 peut être choisie parmi les dix-neuf 
chevaux restants ; ce choix fait, l’image de 3 peut être 
choisie parmi les dix-huit chevaux restants. On a 
donc : 

Al 0 = 20 x 19 x 18 = 6840. (4) 

Champion, s’il veut être certain de gagner, devra 
donc jouer 6 840 tiercés s’il y a vingt chevaux partants. 

Plus généralement, dans un ensemble de n élé¬ 
ments, il y a 4P arrangements d’ordre p : 

A p n = n(n — 1) (n — 2)... (n — p + 1). (5) 

• Exemples. La formule précédente s’applique 
toutes les fois qu’on désire ranger p à p un ensemble 
d’objets en tenant compte de leur ordre. Voici quel¬ 
ques exemples d’utilisation de cette formule. 

1 - Combien de drapeaux à trois couleurs juxta¬ 
posées (comme dans le drapeau français) peut-on 
composer avec les sept couleurs de l’arc-en-ciel ? Un 
drapeau est un arrangement d’ordre 3 dans l’ensemble 
des sept couleurs, on a donc : 

A? = 7x6x5 = 210 drapeaux possibles . ( 6 ) 

2 - Dans un sondage commercial, on demande 
aux personnes interrogées de classer dans l’ordre de 
leur préférence les quatre qualités, choisies dans un 
ensemble de dix^qualités, qu’elles exigent d’une auto¬ 
mobile. Combien peut-on obtenir de réponses différen¬ 
tes ? Il s’agit d’un arrangement d’ordre 4 dans un 
ensemble de dix éléments ; le nombre de réponses 
différentes est : 

A* 0 = 10x9x8x7 = 5 040 réponses possibles . (7) 

Combinaisons. 

• Définition. Si l’on ne tient pas compte de 
l’ordre, tout sous-ensemble de E contenant p éléments 
s’appelle une combinaison. Reprenons l’exemple du 
parieur qui joue des tiercés choisis dans un ensemble 
de vingt chevaux. S’il trouve que jouer 6 840 tiercés est 
trop onéreux pour sa bourse, il peut renoncer à 
« couvrir » toutes les possibilités d’arrivées et se 
contenter d’un gain « dans le désordre ». Dès lors, 
pour lui, un tiercé tel que {3,4,5} est identique à 
{4, 5, 3}, ou à {5, 4, 3}, etc. Au lieu de jouer les six 
permutations possibles d’un sous-ensemble quelcon¬ 
que { x, y, z}, il n’en jouera qu’une seule. Le nombre de 
combinaisons est alors six fois moins élevé que celui 
des arrangements : 

Clo = ^p=1140. ( 8 ) 


D’une manière générale, puisqu’à chaque combinai¬ 
son de p éléments de E correspondent p ! arrange¬ 
ments obtenus en permutant les éléments de ce 
sous-ensemble, le nombre total de combinaisons de p 
éléments pour un ensemblè E de n éléments est : 


C p n 


A p n (n — 1) (n -2)...(n - p + 1) 
Pp P ! 


Le nombre C£, qui se lit : « C, p dans n », s’écrit 

souvent ( n ), notation que nous utiliserons doréna¬ 
vant. W 


• Exemples. 

1 - Un atelier comporte 50 employés dont 10 
« anciens », qui travaillent dans cet atelier depuis plus 
de 5 ans. On forme un Comité d’Entreprise de 
5 employés dont le Président doit être obligatoirement 
un « ancien » ; combien de comités peut-on consti¬ 
tuer ? 

Choisissons un président parmi les dix anciens ; il 
reste 49 employés devant être groupés 4 par 4 (le 
Président étant le cinquième membre du Comité). On a 


donc 



combinaisons possibles avec un président 


déterminé ; comme il y a 10 présidents possibles, on 


obtient 10 x 


comités possibles, soit : 


10 x 


49 x 48 x 47 x 46 
4l 


= 2 118 760. 


( 10 ) 


2 - Le bridge est un jeu qui se joue avec 
52 cartes, entièrement distribuées entre quatre 
joueurs, dont chacun possède donc 13 cartes ; un 
ensemble de 13 cartes s’appelle une main de bridge. 
Combien y a-t-il de mains possibles ? Chaque main est 
une combinaison d’ordre 13 dans l’ensemble de 


52 cartes ; il y a donc : 



mains possibles, soit : 


/ 52 \ 52 x 51 x 50 x 49 x 48 x 47 x 46 x 45 x 44 x 43 x 42 x 41 x 40 

\13/ 13! 

= 635 013 559 600. (11) 


Répétitions. 

Si l’on admet que certains objets peuvent être répé¬ 
tés, on parlera de permutations, d’arrangements et de 
combinaisons avec répétitions. 

• Permutations avec répétitions. Soit n objets 
comprenant a' exemplaires de l’objet a, b' exemplaires 
de l’objet b,..., /' exemplaires de l’objet / ; on a évidem¬ 
ment : 

n = a' + ô' -1— + I'. (12) 

Convenons d’appeler a l5 a 2 , ... les a' exemplaires de 
l’objet a, £ 7 , b 2 , ... ceux de l’objet b, etc. On constitue 
un ensemble E de n éléments distincts qui admet / ! 
permutations. Soit par exemple un ensemble de 
7 gâteaux, ainsi dénommés : 

une meringue : a ; 

deux babas : b, et b 2 ; 
trois éclairs : c v c 2 et c 3 ; 
une tarte : d. 

L’ensemble de ces, sept gâteaux est donc : 

E = {a, b„ b 2 , c„ c 2 , c 3 , d). (13) 

Arrangeons ces gâteaux selon trois ordres d’assorti¬ 
ments, comme sur le tableau ci-dessous : 


Rang 

Assortiment 

Assortiment 

Assortiment 

1 

II 

III 

1 

a 

c 3 

c 2 

2 

b, 

b , 

b 2 

3 

b 2 

b 2 

b, 

4 


c 2 

c 1 

5 

c 2 

c^ 

C 3 

6 

d 

a 

a 

7 

^3 

d 

d 


L’assortiment II est une permutation de l’assorti¬ 
ment I ; de même pour l’assortiment III. Par contre les 
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1. Permutations de trois 
pièces de monnaie : il 
existe P 3 3 ! 6 permu¬ 

tations possibles de trois 
éléments, d’où les six 
séries verticales de pièces 
de monnaie représentées 
sur cette photographie. 


2. Arrangements de 
trois pièces prises deux à 
deux (on a groupé les 
arrangements qui ne diffè¬ 
rent que par l’ordre des 
pièces). Le nombre total 
des arrangements possi¬ 
bles est : 


Ai = 


3! 

(3-2)! 


3. Combinaisons de 
trois pièces deux à deux. 
Le nombre total des 
combinaisons possibles 
est : 

3(3-1) (3-2) 

C 3 - 21 -= 3 - 


assortiments II et III ne diffèrent que par les exemplai¬ 
res choisis: les rangs 1, 4 et 5, par exemple, sont 
occupés par un même type de gâteaux (éclairs), mais 
on a, dans III, c 2 au lieu de c 3 , c 1 au lieu de c 2 , c 3 au lieu 
de c v etc. On convient que deux assortiments de ce 
genre, tels que, à tout rang, les éléments soient de 
même type, sont des permutations équivalentes. 
Comme il s’agit d’une relation d’équivalence sur 
l’ensemble des permutations de E, on peut parler de 
classes d’équivalence. On démontre que ce nombre de 
classes a pour valeur : 


• Arrangements avec répétitions. Prenons 
l’ensemble des n = 26 lettres de l’alphabet, et tous les 
mots de p = 5 lettres qu’on peut écrire, avec éventuel¬ 


lement répétition d’une ou plusieurs lettres : homme 
est un de ces mots (une répétition, celle de la lettre m), 
mais aussi hhhhh (5 répétitions) ou hiooo 
(3 répétitions), etc. On montre qu’on peut former 
26 5 arrangements de cette sorte ; d’une façon géné¬ 
rale, pour n éléments pris p à p, on aurait n p arrange¬ 
ments possibles avec répétitions. 

• Combinaisons avec répétitions. Si l’on ne tient 
pas compte de l’ordre et si l’on admet les répétitions, le 
nombre K p de combinaisons avec répétitions est : 

K" = ( n + p _1 )- (15) 

Le symbole (dans le deuxième membre) étant pris 
avec le sens que nous lui avons donné p. 34. 


A lotions sur les substitutions 


Définition. 

Soit E un ensemble fini composé de n éléments : 
E = { a, b, c, ..., n}. Il existe, on l’a vu, n ! permutations 
possibles des n éléments de E. L’opération par laquelle 
on passe d’une permutation à une autre est une 
application de E dans lui-même. Soit par exemple un 
ensemble E contenant trois éléments, a, b, c et 
considérons l’application E —> E qui applique a sur b, 
b sur c et c sur a. 

Nous pouvons décrire cette application de la 
manière suivante : 

a —» b 
b-+ c 
c^> a 

ou, plus simplement, en écrivant les deux ensembles 
dans leur ordre respectif : 

abc 
b c a 

(l’ensemble de départ est en haut, l’ensemble d’arrivée 
est en bas). L’application bijective ainsi notée est 
appelée une substitution de degré n (n étant le nombre 
d’éléments de l’ensemble E). Nous la désignerons par 
le symbole s, ce qui nous fait écrire : E —E. 

Il ne faut pas confondre permutation et substitution : 
une permutation est le résultat d’une substitution, et 
non cette opération elle-même. 


Caractères d'une substitution. 

• Une substitution identique , ou substitution 
neutre, est une substitution qui conserve tous les 
éléments de l’ensemble E dans le même ordre. Voici 
quelques exemples de substitutions neutres dans un 
ensemble à trois éléments : 


f a * f a c b\ /b a c\ 
\a b c) \a c bJ \b a c) 


• Transposition. Une substitution qui n’échange 
que deux éléments d’un ensemble s’appelle une 
transposition ; on peut la noter par la lettre t et l’écrire 
sous la forme : 

E-^E. 

Par exemple les deux permutations : 

{a b c d e f) et { a b e d c f) 

se correspondent dans une transposition, car seuls 
sont échangés les éléments c et e, tous les autres 
restant à leur place. Si l’on note E le premier ensemble, 
le second sera dit transposé de E et noté ( E. Il est facile 
de montrer que si l’on fait subir à l’ensemble f E la 
transposition t, on retrouve l’ensemble initial : 

t ( t E) = E (1) 

• Parité d’une substitution. On démontre que 
toute substitution peut être réalisée en procédant à 
plusieurs transpositions successives. La substitution 
est dite paire ou impaire selon que le nombre de 
transpositions qui lui correspond est lui-même pair ou 
impair. 

• Produit de deux substitutions. Si l’on fait subir 
à l’ensemble E deux substitutions successives, s, et s /f 
on obtient une permutation qui pourrait être aussi 
atteinte par une substitution unique s k appelée produit 
des substitutions s,- et s y . Désignons ce produit par le 
symbole « x », on écrira : 

Si x s, = s k . (2) 

Le produit de deux substitutions a des propriétés 
remarquables, que nous exploiterons p. 40, en étu¬ 
diant les groupes. Énumérons-les rapidement. 

1 - Le produit de deux substitutions est une 
substitution. 

2 - Le produit de deux substitutions n’est pas 
commutatif en général : la succession s, puis s y donne 
un résultat différent de celui obtenu par la succession 
Sj puis s r On peut vérifier ce fait sur un ensemble 
E { a, b, c} e n définissant les substitutions : 


abc 
b c a 


et s 3 = 


abc 
bac 


(3) 


Partons de l’ensemble { a, b, c }. La substitution s 2 le 
transforme en { b, c, a } ; la substitution s 3 appliquée à 
l’ensemble {b, c, a} donne {a, c, b} (puisque s 3 
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change a en b, b en a et c en c). L’ensemble d’arrivée 
est donc {a, c, b}, obtenu à partir de l’ensemble 
{a, b, c} par la substitution : 


S 4 


abc 
a c b 


(4) 


Nous écrirons donc : 


s 2 x s 3 — s 4 . ( 5 ) 

Procédons maintenant dans l’ordre inverse. En 
appliquant s 3 à l’ensemble {a, b, c} on obtient 
{£>, a, c}; en appliquant ensuite s 2 à l’ensemble 
{b, a, c} on obtient l’ensemble { c, b, a}, qui est 
l’ensemble d’arrivée du produit s 3 x s 2 . On constate 
que le résultat de ce produit est différent du résultat du 
produit s 2 x s 3 , on a donc, en posant : 


S 5 — 


( 6 ) 


a b c] 

[c b a)’ 
s 3 x s 2 = s 5 . (7) 

3 - Le produit de plusieurs substitutions est 
associatif, ce qui s’écrit : 

S^ x (s 2 X s 3 ) = (s, X s 2 ) X s 3 = s,x S 2 x s 3 . ( 8 ) 

4 - La substitution identique St est telle que : 

s 1 X S, = Si x S 1 = Si , (9) 


Sj désignant une substitution quelconque. C’est-à-dire 
que si l’on fait le produit d’une substitution identique 
s 1 et d’une substitution quelconque s,, tout se passe 
comme si on faisait seulement la substitution s ( . 

5 - Deux substitutions sont dites inverses (ou 
symétriques) si leur produit donne la substitution 
identique. Par exemple : 


f a b c\ f b c a\ f a b c\ 
\b c a) X [a b c) ~ [a b c) 


( 10 ) 


En effet, l abc 
\b c a 

en l’ensemble { b, 

transforme l’ensemble {b, c, a} en l’ensemble 
{a, b, c }. 

La substitution inverse d’une substitution s quelcon¬ 
que se note habituellement s 


transforme l’ensemble {a, b, c} 

c, a} et la substitution ( b c a 
\a b c 


Autres problèmes d'analyse 
combinatoire. 


Partition d'un ensemble fini. 


Soit E un ensemble fini contenant n éléments : 
combien de sous-ensembles peut-on construire dans 
cet ensemble, en comptant l’ensemble vide 0 et 
l’ensemble E lui-même? (Voir p. 15, où est défini 
l’ensemble des parties d’un ensemble). 

Un sous-ensemble particulier de E contient p élé¬ 
ments de E, avec p «£ n. Si p = 0, le sous-ensemble est 
vide ; si p = n, il se confond avec E. Le nombre de 


sous-ensembles possédant p éléments est 



que l’ordre des éléments n’intervient pas ; il y aura 


donc : ^ j ensemble vide, ^ ^ ensembles à un élé¬ 
ment, ensembles à deux éléments, ..., ensem¬ 
ble E. Le nombre total de sous-ensembles de E est 
donc : 


© + 0 *"* 0 + "'* 0 - 2 -- <’> 

égalité qui se vérifie aisément, en utilisant la formule 
des combinaisons. 


Problèmes variés. 

• Comment représenter le nombre m + n en 
tant que somme de n entiers positifs. Le nombre de 
représentations possibles P(n, m) a été étudié par 
Euler, qui a montré que : 

P(n,m)='£s,m-s. (2) 

• Fonctions symétriques d’une équation. Voir la 
théorie des équations, p. 70. 

• Matrices et déterminants. Voir pp. 58-65. 



« Ni vu, ni connu, je t’embrouille » semble dire /'Escamoteur de Jérome Bosch à ses spectateurs : l'algébriste 
apparaît, lui aussi, comme un magicien quand, devant un public de profanes, il résout des problèmes en 
apparence saugrenus, que l’arithmétique classique est impuissante à résoudre. 


ALGÈBRE DES STRUCTURES. 


Remarque historique. 

Nous reprenons ici l’histoire de l’algèbre au point où 
nous l’avions laissée p. 12 . Nous avons vu qu’au 
début du XIX e siècle les travaux de Gauss, de Galois 
conduisent les mathématiciens à laisser au second 
plan le problème de la résolution des équations et à se 
tourner vers l’étude des structures algébriques. 

La notion de loi de composition et la théorie des 
groupes. 

• Gauss et la théorie des formes quadratiques. 
Nous avons vu, en arithmétique, qu’il était possible de 
représenter un nombre entier par une forme quadrati¬ 
que, c’est-à-dire par une expression algébrique telle 
que : 

f = ax* + bxy + cy *. (1 ) 

Gauss a étudié les formes quadratiques, et il a 
montré qu’on pouvait les ranger en classes d’équiva¬ 
lence, sur lesquelles on pouvait calculer comme on 
calculerait sur des nombres, en définissant notamment 
une opération permettant de combiner deux formes 
quadratiques / r 1 et f 2 de telle sorte qu’on obtienne, par 
cette combinaison, une troisième forme quadratique 
f 3 , et cela d’une manière commutative, la combinaison 
(f,, f 2 ) donnant le même résultat que la combinaison 
(f 2 , f A ). Ainsi se dégage l’importance de la notion de loi 
de composition dans un ensemble : étant donné deux 
éléments x et y d’un ensemble E, on peut leur faire 
correspondre un troisième élément z E E selon une loi 
générale qu’on appelle loi de composition. 

Ainsi, dans l’ensemble Z des entiers, à tout couple 
(x, y) correspond un troisième entier qu’on nomme 
leur somme, et qu’on obtient selon des règles opératoi¬ 
res précises. L’addition des nombres entiers est donc 
une loi de composition particulière, caractérisant 
l’ensemble Z. Plus généralement, étant donné un 
ensemble E, fini ou infini, il est possible de le caracté¬ 
riser par les lois de composition dont on peut le munir. 
Ces lois décrivent ce qu’on appelle la structure de 
l’ensemble considéré. Nous verrons que l’algèbre 
moderne s’est donnée pour objet l’étude générale des 
structures, par opposition à l’algèbre classique qui 


étudiait des structures particulières sans établir de lien 
entre les catégories d’opérations réalisées dans des 
ensembles différents. 

• Galois et la théorie des groupes. Dans un 
Mémoire sur les conditions de résolubilité des équa¬ 
tions par radicaux, présenté le 16 janvier 1831 à 
l’Académie des Sciences, Galois a établi que, pour 
étudier une équation algébrique du n-ième degré, il 
fallait examiner l’ensemble des permutations de ses 
racines, ensemble qu’il nomme un groupe de substitu¬ 
tions. Si (a, b, c, d, ... m) sont les m racines d’une 
équation, le groupe de substitutions associé à cette 
équation est composé de toutes les permutations 
possibles des racines (nous avons vu p. 34 qu’il y en 
a m\). En elle-même, cette idée n’était pas très 
nouvelle, car elle avait été développée à partir de 1770 
par Lagrange, puis par Vandermonde et par Gauss. 
Ce qui est absolument nouveau chez Galois, c’est 
que, d’emblée, il analyse les propriétés générales des 
groupes (et non pas uniquement celles des groupes 
qui servent à la résolution d’une équation), et qu’il 
découvre l’importance capitale de la notion d’inva¬ 
riance et de celle de sous-groupe. 

Les groupes de substitutions étudiés par Galois sont 
des groupes finis (le nombre de leurs éléments est fini). 
L’étude plus systématique de leurs propriétés a été 
faite par Camille Jordan (1870), Félix Klein (1874), 
R. Lipschitz (1877), Kronecker (1882), Dedekind (1884) 
et O. Hôlder (1893). 

Par la suite, on s’aperçut du rôle primordial joué par 
la structure de groupes dans de nombreux domaines 
des mathématiques et, à la théorie des groupes finis, 
s’est adjointe celle des groupes continus (Sophus Lie, 
1870), devenue l’une des théories à la base de l’étude 
des fonctions continues. La théorie de Lie a été 
généralisée, au début du XX e siècle, par Elie Cartan 
(1917), H. Weyl (1925) ; elle joue un rôle important dans 
une branche des mathématiques qu’on appelle mainte¬ 
nant la topologie algébrique (Chevalley, Koszul, Henri 
Cartan, A. Borel, Serre, R. Bott, etc.). 

Développement de l'algèbre des structures. 

• A la fin du XIX e et au début du XX e siècle, des 
ensembles obéissant à d’autres lois générales que les 
groupes ont fait l’objet d’analyses approfondies. Dede¬ 
kind introduit la notion de corps (qui existait en 
puissance dans les travaux de Gauss sur la théorie des 
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nombres), pour décrire notamment l’ensemble des 
nombres réels, celui des nombres complexes et celui 
des ;onc*ions de variables réelles ou complexes ; ces 
ensembles sont classiquement appelés « concrets ». 
Kronecker est à l’origine (1887) de la considération de 
corps dits « abstraits », tels les corps finis , les corps 
p-adiques (Hensel, vers 1900), les corps des séries 
formelles (G. Veronese, 1891). 

L’aboutissement de ces recherches particulières est 
la synthèse de E. Steinitz, sous la forme d’un article 
paru dans le Journal de Crelle , en 1910, sur la Théorie 
algébrique des corps. Ce travail est considéré comme 
le point de départ conscient et organisé de l’algèbre 
moderne. 

• L’algèbre linéaire , c’est-à-dire l’algèbre qui 
repose sur des combinaisons du premier degré, s’est 
développée à partir du milieu du XIX e siècle, avec les 
travaux de W. R. Hamilton sur les quaternions (1853) 
et les vecteurs, et ceux de Cayley (à partir de 1846) et 
Sylvester (1850) sur les matrices et les déterminants 
(dont l’introduction remonte à Cramer, en 1750 ; le mot 
« déterminant » a été utilisé en son sens moderne par 
Cauchy). Les travaux de Grassmann sur le calcul 
algébrique appartiennent au même mouvement de 
pensée. 

• Vers 1900-1910, il semble donc acquis qu’il 
existe non pas une algèbre portant sur l’ensemble des 
nombres complexes (les réels étant un cas particulier 
des complexes), mais des algèbres décrivant des 
ensembles dont la structure peut être extrêmement 
variée. A la suite de Benjamin Peirce, auteur de 
travaux sur l’algèbre linéaire associative (1861), les 
algébristes ont entrepris de classer les différentes 
algèbres (Study, C. S. Peirce, fils de Benjamin Peirce, 
Scheffers, Schur, Molien, Elie Cartan). Ces préoccupa¬ 
tions rejoignent celles de Steinitz, déjà cité, tandis que 
E. Noether (entre 1920 et 1930) et W. Krull développent 
la théorie des anneaux commutatifs, en rapport avec 
les préoccupations de la géométrie algébrique, à 
l’origine de laquelle se trouvent les travaux de Riemann 
(1851). 

Conclusion. 

Ce panorama historique se termine aux environs de 
1930, époque à laquelle paraît le livre célèbre de 
E. L. Van der Waarden intitulé Algèbre moderne, et qui 
récapitule tout ce qui vient d’être dit. Vers 1930 on 
pouvait donner de l’« algèbre » en général la définition 
suivante : P« algèbre » traite des ensembles dont la 
structure est définie par une ou plusieurs lois de 
composition (de deux éléments pris dans deux ensem¬ 
bles différents). Il y a donc autant d’algèbres que de 
structures possibles, c’est-à-dire, théoriquement, une 
infinité. Tout le monde est cependant bien d’accord sur 
le fait que seules les algèbres créées en rapport avec 
des problèmes en suspens dans un domaine mathéma¬ 
tique ont une certaine fécondité. 

Lorsqu’on cherche à classer les divers domaines 
étudiés par les mathématiques contemporaines, on est 
très vite dépassé par la variété des spécialisations, par 
l’enchevêtrement des théories, par la confluence des 
résultats. Il est impossible, de nos jours, d’écrire une 
histoire des mathématiques dont les chapitres 
seraient : théorie des ensembles, théorie des nombres 
(arithmétique), algèbres, géométrie, analyse, topolo¬ 
gie. Tous ces domaines s’interpénétrent. Il serait donc 
vain et inutile — dans la mesure où ce livre s’adresse 
non pas à des spécialistes mais à des lecteurs qui 
désirent compléter leur culture générale — de conti¬ 
nuer la liste chronologique des travaux en rapport avec 
l’algèbre moderne depuis un demi-siècle. Nous donne¬ 
rons à propos de chaque sujet important, des informa¬ 
tions historiques adéquates. 


Généralités. 


Lois de composition. 

La structure d’un ensemble E, finie ou infinie, est 
caractérisée par la ou les lois de composition qu’on 
peut appliquer aux éléments de cet ensemble. 

• Notation. Une loi de composition est notée 
par un signe conventionnel ; on emploie souvent le 
symbole « X » (appelé couramment « antitruc » en 
langage familier) et le symbole « T » (« truc »). Les lois 
de composition peuvent être aussi notées à l’aide du 
signe « + » (notation additive) ou du signe « x » (nota¬ 
tion multiplicative), ou encore sans aucun signe (nota¬ 
tion multiplicative). On rencontre aussi Vétoile « * » ou 
le rond « o » (ces deux derniers symboles sont décon¬ 
seillés). 

• Loi de composition interne. Soit 


E = { x, y, z, ...} un ensemble et E x E = E 2 le carré 
cartésien de cet ensemble (voir la définition p. 22 ). 
L’ensemble E 2 est composé de tous les couples (x, y) 
et on appelle loi de composition interne toute opéra¬ 
tion qui fait correspondre à un élément (x, y) de E 2 un 
élément et un seul z E. E, c’est-à-dire l’application de 
E 2 dans E (voir la définition d’une application p. 20). 
On écrira : 

x±y=z. ( 1 ) 

L’élément x ± y = z est le composé de x et de y. 

• Loi de composition externe. Soit 
il = { a, (3, y, ... } un ensemble et E= { x, y, z, ... } un 
autre ensemble. On appelle loi de composition externe 
toute loi qui fait correspondre à un couple (a, x) dont 
les membres sont pris l’un dans l’ensemble il et l’autre 
dans l’ensemble E, un élément y de l’ensemble E. Les 
couples (<*, x) constituent le produit cartésien il x E : 
la loi de composition externe est une application de 
l’ensemble il x E dans E. L’ensemble il est appelé 
domaine d’opérateurs de la loi. 

• Exemples de lois de composition interne. 

— Exemple arithmétique. Soit l’ensemble Z des 

entiers. L’addition, qui fait correspondre à deux entiers 
x et y leur somme z est une loi de composition 
interne ; il en est de même de la multiplication (la 
somme ou le produit de deux entiers est un entier). On 
notera ces deux lois de composition avec un symbole 
différent, par exemple : 

x X y = z ( 2 ) 

pour l’addition et : 

x T y = z (3) 

pour la multiplication. On peut aussi noter l’addition à 
l’aide du symbole « + » et la multiplication à l’aide du 
symbole « x » ou sans aucun signe (c’est d’ailleurs 
ainsi que l’on procède habituellement). 

— Exemple géométrique. Considérons l’ensem¬ 
ble E= { d A , d 2 , d 3 , ...} des déplacements, c’est-à-dire 
des transformations qui permettent de passer d’une 
figure F à une figure F qui lui est directement égale. 
Définissons la loi de composition appelée « produit de 
deux déplacements » et notée d 1 X d 2 de la manière 
suivante : faire subir à une figure F le produit de deux 
déplacements d 1 et d 2 , c’est : 1° passer de F à F' par le 
déplacement d 1 ; 2° passer de P à F" par le déplace¬ 
ment d 2 . On démontre, en géométrie, qu’il est alors 
toujours possible de passer de Fà F" par un troisième 
déplacement distinct d 3 . On peut donc écrire : pour 
tout d l5 d 2 , d 3 appartenant à E, on a : 

d, x d 2 = d 3 . (4) 

Le produit de deux déplacements est une loi de 
composition interne dans l’ensemble des déplace¬ 
ments. 

Propriétés d'une loi de composition. 

• Loi commutative. Une loi de composition 
interne définie sur un ensemble E est dite commuta¬ 
tive si, pour tout couple (x, y) d’éléments de E, on a : 


LOIS DE COMPOSITION 

• Distributivité d’une loi de composition 
externe. Appelons X une loi de composition interne 
définie dans un ensemble E, et T une loi de composi¬ 
tion externe faisant intervenir l’ensemble 
Q = { a, /3, y, ... }, comme on l’a expliqué ci-dessus. 
La loi de composition externe est dite distributive par 
rapport à la loi interne si, pour tout élément X E Ç2 et 
pour tout couple (x, y) d’éléments appartenant à E 
on a : 

A X (x T y) = (A X x) T (A X y). (9) 

Éléments caractéristiques. 

Considérons un ensemble E muni d’une loi de 
composition interne. Il peut se trouver que certains 
éléments, composés à des éléments quelconques de E, 
aient des propriétés particulières. Nous allons définir 
ces éléments. 

— Un élément e E E est dit neutre pour la loi X 
si, pour tout x E E on a : 

eXx = xXe = x. (10) 

Par exemple, dans l’ensemble Z, l’élément 0 est 
neutre pour l’addition ; on a en effet 0 +x=x+ 0 = x. 
De même 1 est l’élément neutre pour la multiplication, 
puisqu’on a 1 x x = x x 1 = x. 

— Soit E un ensemble muni d’une loi de compo¬ 
sition interne X et possédant un élément neutre e pour 
cette loi de composition. Si, pour un couple (x, y) 
d’éléments appartenant à E on a : 

y x x = e , ( 11 ) 

on dit que l’élément y est un symétrique à gauche de 
x ; x lui-même est dit symétrisable à gauche. 

Dans les mêmes conditions, s’il existe un élément z 
de E tel que : 

x X z = 0 , (12) 

on dit que l’élément z est un symétrique à droite de x, 
et x est dit symétrisable à droite. 

— Toujours dans les mêmes conditions, s’il 
existe un couple d’éléments (x, y) appartenant à E tel 
que : 

xXy=y±x=e (13) 

les deux éléments sont dits symétriques. Lorsque la loi 
de composition interne est associative, l’élément y, s’il 
existe, est unique : on l’appelle le symétrique de x, et 
on le note - x ou x -1 . On dit encore que x et - x (ou 
x -1 ) sont des éléments opposés. 

Nous avons vu p. 25, qu’il n’existait aucun entier 
naturel tel que a + b = b + a = 0 : les entiers naturels 
ne sont donc pas symétrisables pour l’addition. Par 
contre, dans l’ensemble Z, on peut toujours associer à 
un entier x son opposé — x, de sorte que x — x = 0 : 


Sophüs Lie (1842-1899), mathématicien norvégien 
qui a notamment reconnu l’importance de l’idée de 
groupe continu de transformation (<< groupe de 
Lie »). 


xX y = y X x. (5) 

(C’est le cas pour l’addition et la multiplication dans Z 
par exemple.) 

• Loi associative. Une loi de composition 
interne définie sur un ensemble E est dite associative 
si, pour tout triplet (x, y, z) d’éléments appartenant à E, 
on a : 

(xxy)Xz=xX(yXz) = xXyXz. (6) 

L’addition dans Z est un exemple de loi associative. 
Pour faire la somme 3 + 5-2, par exemple, on peut 
indifféremment additionner d’abord 3 et 5, ce qui fait 8 , 
et ôter 2 du résultat, d’où 3 + 5 - 2 = 6, ou bien ajouter 
3 au résultat de l’opération 5 - 2, ce qui donne égale¬ 
ment 6 . Un ensemble muni d’une loi de composition 
interne associative est appelé un monoïde. 

• Loi distributive par rapport à une autre loi. 
Considérons un ensemble E muni de deux lois de 
composition interne, notées X et T. Si, pour tout triplet 
(x, y, z) d’éléments appartenant à E, on a : 

x T (y X z) = (x T y) X (x T z), m ^ 

(y X z) T x = (y T x) X (z T x), v ,§> 

chacune des deux lois est dite distributive par rapport J 
à l’autre. * 

Considérons par exemple l’addition et la multiplica- ^ 

tion dans Z. On a, pour tout triplet d’entiers (x, y, z) : | 
x(y + z)= xy+xz-, J 

(y + z) x = xy + xz. K ' | 

La multiplication est donc distributive par rapport à 
l’addition, et réciproquement. § 
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les éléments de l’ensemble Z possèdent tous un 
symétrique pour l’addition, à l’exception de 0 qui est à 
lui-même son symétrique. 

— Tout élément x d’un ensemble E muni d’une 
loi de composition interne _L et vérifiant la relation : 

x±x = x (14) 

est appelé élément idempotent. Par exemple, dans 
l’ensemble Z, 0 est idempotent pour l’addition, puisque 
0 + 0 = 0; de même 1 est idempotent pour la multipli¬ 
cation, puisque 1x1=1. 

— E étant muni d’une loi de composition 
interne X, un élément de a G E, tel que pour tout 
couple (x, y) d’éléments de E on ait : 

a X x = al y => x = y (15) 

est dit élément régulier à gauche (on dit aussi élément 
simplifiable à gauche). De même, pour tout élément b 
de E tel que : 

xlb = ylb=>x = y (16) 

est dit élément régulier ou simplifiable à droite. Un 
élément régulier à gauche et à droite est dit, simple¬ 
ment, élément régulier ou encore élément simplifiable. 
C’est ainsi que tout nombre réel est régulier pour 
l’addition et la multiplication, puisqu’on a, par exem¬ 
ple, a, x et y appartenant à l’ensemble (R : 

fa + x = a + y=>x = y, 

( ax = ay => x = y . ' 1 ' ' 

Cette régularité des éléments de l’ensemble IR des 
réels permet les simplifications classiques du calcul 
algébrique élémentaire : ajouter ou retrancher un 
même nombre aux deux membres d’une égalité sans 
changer cette égalité, ou encore multiplier ou diviser 
les deux membres d’une égalité par un même nombre 
réel sans changer cette égalité. 

— E étant un ensemble muni d’une loi de 
composition interne X, un élément x de E est dit 
absorbant à gauche si, pour tout élément y G E, on a : 

x 1 y = x. (18) 

De même, il est dit absorbant à droite si, pour tout 
yG E, on a : 

y X x = x. (19) 

Un élément absorbant à gauche et à droite est dit 
élément absorbant. 

Ainsi, dans l’ensemble IR des réels, 0 est un élément 
absorbant à gauche et à droite pour la multiplication, 
puisqu’on a, quel que soit le réel x : 

0xx = xx0 = 0. (20) 


Remarques. 

1 - On utilise le signe « + » pour noter une loi de 
composition interne sur un ensemble E, lorsque celle- 
ci est commutative et associative ; dans ce cas, l’élé¬ 
ment nul est noté « 0 », et le composé x + y est appelé 
somme de x et de y. Lorsque l’ensemble considéré est 
un ensemble de nombres (entiers, fractionnaires, réels, 
complexes, etc.), ces symboles ont la signification qui 
leur est donnée en arithmétique élémentaire. Mais il ne 
faut pas perdre de vue le fait qu’on peut noter à l’aide 
de ces symboles des lois de composition concernant 
des éléments qui ne sont pas numériques. Par exemple 
l’ensemble des vecteurs géométriques est muni d’une 
loi de composition interne appelée addition vectorielle, 
et qui fait correspondre à deux vecteurs V et V un 
troisième vecteur IV appelé leur somme. On écrit 
alors : 

IV = V+ V . (21) 

Le signe « + » indique que le vecteur IVs’obtient en 
prenant la diagonale du parallélogramme construit sur 
les vecteurs V et V' (voir p. 48). 

2 - La notation multiplicative, qui utilise le signe 
« x » placé entre deux éléments d’un ensemble E, ou la 
simple juxtaposition xy des deux éléments de cet 
ensemble est utilisée pour noter une loi de composi¬ 
tion interne associative (et non nécessairement 
commutative). Dans ce cas, l’élément neutre est appelé 
élément unité, et noté 1 ; le composé de la multiplica¬ 
tion de deux éléments x et y de E est appelé produit. 

3 - L’élément symétrique d’un élément symétri- 
sable x d’un ensemble E, pour une loi de composition 
interne est noté —x, s’il s’agit d’une loi de composition 
interne associative et commutative, c’est-à-dire notée 
additivement ; on le note x^ 1 ou 1/x, s’il s’agit d’une loi 
de composition interne associative (et non nécessaire¬ 
ment commutative), possédant un élément neutre 1 et 
notée multiplicativement. 


4 - Pour décrire la structure algébrique d’un 
ensemble, on définit les lois de composition internes 
ou externes concernant cet ensemble, ces lois pouvant 
présenter entre elles certaines relations (par exemple 
la distributivité), et on énonce sous forme d’axiomes 
leurs propriétés (associativité, commutativité, distribu¬ 
tivité), ainsi que l’existence éventuelle d’éléments neu¬ 
tres, symétrisables, absorbants, etc. On désigne parfois 
la structure algébrique d’un ensemble par le symbole 
(S). 

5 - (S) étant une structure algébrique définie sur 
un ensemble E par plusieurs lois de composition 
(internes ou externes), on appelle structure 
sous-jacente à la structure F la structure algébrique 
obtenue en ne considérant sur E qu’une partie des lois 
qui définissent F. 

6 - E étant un ensemble dans lequel est définie 
une loi de composition interne, une partie P de E pour 
laquelle le composé de tout couple d’éléments appar¬ 
tenant à P est encore un élément de P est dite partie 
stable pour la loi en question. On peut définir de même 
une partie stable pour une loi de composition externe, 
si le composé de tout couple (a, x), a G Cl, x G P, est 
lui-même un élément de P. Enfin, E étant un ensemble 
muni d’une structure algébrique, s’il existe une partie 
P de E stable pour chacune des lois définissant cette 
structure, cette partie P est dite stable pour la structure 
(S). 


Morphismes. 

• Généralités. Lorsqu’on applique un ensemble 

E, muni d’une structure (S), dans un ensemble F, 
chaque élément x G E est mis en correspondance avec 
un élément f(x) de F, élément qui est dit image de x 
dans F (voir p. 20). On peut évidemment définir 
une structure (T) pour F et faire correspondre chaque 
loi de composition dans E à une loi de composition 
dans F. 

Pour fixer les idées, appelons X les lois de composi¬ 
tion interne sur E et X' les lois de composition externe 
dans cet ensemble, et soit T et T' les lois de 
composition interne et externe correspondantes dans 

F. Alors nous associons d’une manière biunivoque : 

11 à T,; 

1 2 à T 2 ; 

etc. 

Xj à T( ; 

x 2 à T«J ; 

etc. 

Si la structure (T) est telle que les correspondances 
biunivoques l«-*T, l'<-»T' respectent certaines 
conditions que nous allons définir, l’application f de E 
dans F est appelée un morphisme. L’intérêt d’un 
morphisme se comprend par la remarque suivante. 
Supposons que la loi 1 1 appliquée aux éléments xet y 
de E, donne zG E, tel que : 

z = x 1 1 y. (23) 

Dans l’application f, x devient f(x), y devient f(y) et z 
devient f(z) ; s’il se trouve que : 

f(z) = f(x) T, f(y), (24) 

T 1 étant la loi de composition interne mise en corres¬ 
pondance avec x 1t et s’il en est de même pour toutes 
les lois de composition des deux ensembles E et F, 
l’application peut être un morphisme (voir définition 
rigoureuse ci-après). Supposons que l’opération T ^ 
soit « facile » et l’opération X 1 « difficile ». Au lieu de 
calculer sur les éléments (x, y), à l’aide de 1-,, on 
calculera sur leur image dans F, à l’aide de T 1f et l’on 
reviendra dans l’ensemble E pour exprimer le résultat. 

• Un exemple : les logarithmes décimaux. 
Considérons les deux suites de nombres : 

E = {1 10 10 2 10 3 10 4 10 5 10 6 10 7 10 8 ...} 

F = {0 1 2 3 4 5 6 7 8 ...} 

et établissons l’application E - J F qui fait correspon¬ 
dre 0 à 1, 1 à 10, 2 à 10 2 , etc. La multiplication de deux 
éléments x et y appartenant à E s’écrit, par exemple : 

10 3 x 10 4 = 10 7 . (25) 

L’addition des deux images de x et y dans f s’écrit : 

f(10 3 )+ f(10 4 ) (26) 

et, comme f(10 3 ) = 3 et f(10 4 ) = 4, on a^> 
f( 10 3 ) + f( 10 4 ) = 7. Mais, en considérant les deux suites, J 
on constate que 7 = f(10 7 ), donc : ^ 

f(10 3 )+ f(10 4 ) = f(10 7 ). (27) j* 

« 

Comparons maintenant les relations (25) et (27) : | 
elles se correspondent pour l’application E f > F de la ^ 
manière suivante : § 


10 3 — Uf(10 3 ) = 3; 

10 4 — U f( 10 4 ) = 4; 
lO 7 -^-* f(10 7 ) = 7 ; 

Pour multiplier 10 a par 10 b , on procédera donc 
ainsi : 

1 - remplacer 10 a et 10 fa par leurs images a et b 
dans F; 

2 - calculer, dans F, la somme c = a + b ; 

3 - remplacer c par son antécédent 10 c dans E ; 

4 - le résultat de l’opération 10 a xl0 b est 
10 e = 10 a+b . 

Autrement dit, si nous faisons le détour par l’ensem¬ 
ble F, la multiplication de 10 a par 10 b revient à 
l’addition a+ b, qui est une opération beaucoup plus 
simple. Cette simplification est possible lorsque l’appli¬ 
cation E-!-^ F est un morphisme (en l’occurrence, un 
morphisme d’un type particulier appelé isomor¬ 
phisme). Dans le langage des mathématiciens, chaque 
nombre de l’ensemble Fest appelé logarithme décimal 
du nombre de l’ensemble E qui lui correspond. Cette 
nç>tion a été introduite au début du XVII e siècle par 
l’Écossais Neper et par l’Anglais Briggs (voir à ce sujet 
p. 116 pour la définition de la fonction logarithme.) 


• Définition d’un morphisme. On appelle mor¬ 
phisme une application fd’un ensemble E, muni d’une 
structure algébrique (S), dans un ensemble F, muni 
d’une structure algébrique (T), telle que : 

— pour chaque loi de composition interne X 
dans E, associée à une loi de composition interne T 
dans F par une correspondance biunivoque appliquant 
l’ensemble des lois de composition internes sur E sur 
l’ensemble des lois de composition internes sur F, on 
a : 

f(x _L y) = f(x ) T f(y) , (28) 

et cela pour tout couple (x, y) d’éléments de E ; 

— pour chaque loi de composition externe X' 
définie dans E et ayant pour domaine d’opérateurs O, 
les lois X' étant mises en correspondance biunivoque 
avec les lois de composition externe T' dans F, avec le 
même domaine d’opérateurs, on a : 

f(a X' x) = a T' f(x) , (29) 

pour tout a G Q et pour tout x G E. 


• Différentes sortes de morphismes. 

— On appelle endomorphisme un morphisme 
qui applique l’ensemble E, muni d’une structure (S) 
dans le même ensemble, muni de la même structure. 

— L’ isomorphisme est un morphisme particuliè¬ 
rement important, qui peut se définir comme suit ; 
étant donné deux ensembles E = { x, y, z,...} et 
F= { f{x), f(y), f(z), ...}, s’il existe une loi de composi¬ 
tion interne X dans Eet une loi correspondante T dans 
F, et si l’égalité : 

xl y= z vérifiée sur E (30) 


Loi de composition interne (exemple naïf) : le 
mélange de deux couleurs est une loi de composi¬ 
tion interne dans l’ensemble des couleurs pris au 
sens large (ce mélange fournit une troisième cou¬ 
leur qui appartient à l’ensemble des couleurs). 
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entraîne : 


Monoïdes et groupes. 


STRUCTURE DE MONOIDE 


f(x) JL' f(y) = f(z) vérifiée sur F (31) 

l’application E » F est un isomorphisme. Nous 
aurons l’occasion de préciser cette définition par la 
suite, et de rencontrer d’autres morphismes, qui seront 
définis en temps utile, tel l’automorphisme, qui est 
l’isomorphisme d’un ensemble muni d’une structure 
algébrique sur lui-même, cet isomorphisme étant 
lui-même muni de la même structure. 

Si ces notions vous semblent trop abstraites pour 
l’instant, contentez-vous de retenir ceci : si l’on peut 
établir une correspondance entre les éléments de deux 
ensembles et entre les lois de composition qui définis¬ 
sent les structures de ces deux ensembles, l’applica¬ 
tion de l’un de ces ensembles sur l’autre, désigné par 
E - L -> F est un morphisme. 

Plan. 

Il est dans notre intention de décrire les algèbres en 
partant des théories les plus générales pour aboutir 
aux théories particulières. Cet exposé n’est pas d’un 
accès très aisé, du moins à première vué. En effet, 
quand on s’adresse à des néophytes ou à des profanes, 
on risque de les effrayer en leur présentant, de but en 
blanc, la théorie générale des groupes finis ou les 
algèbres universelles. L’impression la plus fâcheuse 
que l’on risque de provoquer est que les algèbres sont 
des sortes de jeux gratuits de l’esprit, nantis d’un 
symbolisme plus ou moins spectaculaire. 

Pour éviter cette vision fausse des théories algébri¬ 
ques, il faut donner un grand nombre d’exemples 
montrant leur intérêt « concret » ; dès lors tout ce qui 
semblait gratuit ou compliqué prend toute sa raison 
d’être. Il est certain qu’un lecteur ignorant les mathé¬ 
matiques supérieures ne peut s’intéresser à la théorie 
des groupes en tant que telle, à moins qu’il n’ait l’esprit 
perverti par quelques manies. En revanche, dans la 
mesure où il a conscience de l’importance pratique de 
la résolution générale des équations du n-ième degré, 
et si on lui explique que la théorie des groupes est un 
outil puissant permettant de les étudier ; et si, d’autre 
part, on lui a souligné combien les théories géométri¬ 
ques ont été transformées et unifiées grâce à la théorie 
des groupes, ladite théorie prend à ses yeux une 
grande valeur. 

Or, en raison même du plan adopté ici, l’appel à des 
exemples n’est théoriquement pas possible, puisque 
ces exemples seront présentés ultérieurement comme 
des conséquences particulières des théories générales 
exposées en premier lieu. Il nous faut donc demander 
au lecteur d’avoir le courage d’utiliser la voie aride de 
l’abstraction. Voici les détails du plan de notre exposé. 

1 - Dans ce chapitre, nous donnons quelques 
indications sur les structures algébriques les plus 
générales, à savoir, par ordre de généralité décrois¬ 
sante : 

— les monoïdes et les groupes ; 

— les anneaux ; 

— les corps ; 

— les espaces vectoriels. 

Nous définirons ces structures, qui ont été baptisées 
ainsi à la fin du XIX e siècle, et nous étudierons leurs 
propriétés. Nous constaterons au passage — et ce 
n’est pas sans intérêt — que l’ensemble Z des entiers 
relatifs a une structure d’anneau, et que les ensem¬ 
bles [R et C des nombres réels et des nombres comple¬ 
xes ont une structure de corps ; quant à la théorie des 
espaces vectoriels, nous verrons qu’elle débouche sur 
une branche très féconde de l’algèbre moderne : 
l’algèbre linéaire (entendez : l’algèbre du premier 
degré). 

2 - La définition de deux corps très importants : 
ceux des nombres réels et des nombres complexes 
est étudiée aux pages 52 à 57. 

3 - L’exposé des principaux résultats de l’algè¬ 
bre linéaire (théorie des matrices et des déterminants, 
théorie des formes, théorie des invariants, tenseurs), 
outils indispensables de l’algèbre moderne est énoncé 
aux pages 58 à 66. 

4 - Aux pages 66 à 73, nous définirons les 
problèmes particuliers dont l’ensemble constitue classi¬ 
quement Yalgèbre supérieure. La résolution de ces 
problèmes fait appel aux théories évoquées pp. 37 et 
38. Nous aborderons ainsi : 

— la théorie des équations, qui fait appel à la 
théorie des groupes ; 

— l’algèbre des polynômes à une indéterminée, 
qui fait appel à la théorie des anneaux ; 

— l’algèbre des polynômes à plusieurs indéter¬ 
minées, la théorie des formes quadratiques et quelques 
autres questions en rapport avec la théorie des corps. 


Une structure qui comprend au moins une loi de 
composition interne est appelée structure algébrique. 
Une structure algébrique qui possède au moins deux 
lois de composition interne est appelée une algèbre 
(terme qui prend donc un sens différent du sens 
technique usuel). Nous commencerons notre exposé 
de la description des structures par la structure de 
monoïde et par celle de groupe, qui sont des structures 
à une seule opération. Signalons en outre que la 
structure de groupe fut, chronologiquement, la pre¬ 
mière structure mise en évidence (par Galois en 1830). 
Nous dirons d’abord quelques mots des monoïdes, 
dont la structure est plus générale que celle de groupe. 


Monoïdes. 

• Définition. Considérons un ensemble E non 
vide, sur lequel on définit une loi de composition 
interne binaire (c’est-à-dire portant sur deux éléments 
x et y de l’ensemble E), associative, et notée _L. Nous 
supposerons en outre qu’il existe dans l’ensemble E 
un élément noté e qui est neutre pour cette loi. Cet 
ensemble est dit muni d’une structure de monoïde. En 
abrégé, on écrira que (E, _L, e) définit un monoïde. 

• Remarques : 

1 - L’opération _L peut être, selon les cas, 
commutative ou non commutative. On parle alors, 
respectivement, d’un monoïde commutatif ou d’un 
monoïde non commutatif. 

2 - Si E est un monoïde, un sous-ensemble A de 
E est un sous-monoïde s’il contient l’élément neutre e 
et s’il est fermé pour la loi ± dans E (c’est-à-dire que le 
composé al b de deux éléments de A appartient 
lui-même à A; voir p. 38, remarque 6). 

3 - On pourrait imaginer une structure encore 
plus simple : celle d’un ensemble E doté d’une loi de 
composition interne associative, sans faire d’hypo¬ 
thèse sur l’existence de l’élément neutre. Une telle 
structure serait notée (E, _L) ; on l’appelle un 
semi-groupe. 

4 - Enfin, on peut aussi imaginer un ensemble 
dans lequel la loi de composition interne ne serait pas 
associative. Le triplet (E, _L, e) désignerait alors non 
pas une structure de monoïde mais une structure de 
monade. Nous n’en parlerons pas ici. 

• Exemples. Pour montrer qu’un ensemble, 
doté d’une loi de composition interne, est un monoïde, 
il faut démontrer : 1° qu’il n’est pas vide ; 2° que la loi 
de composition interne définie sur cet ensemble est 
associative ; 3° qu’il existe dans l’ensemble un élé¬ 
ment e neutre pour la loi considérée. 

— Le triplet (N, +, 0) est un monoïde. Dans ce 
triplet, N désigne l’ensemble des entiers naturels 
augmenté du zéro, le signe « + » est celui de l’addition 
usuelle, et 0 est le nombre zéro. En effet : 1° N n’est 
pas un ensemble vide ; 2° l’addition (+) des entiers 
naturels est une opération associative (cette propriété 
découle des axiomes définissant les entiers naturels) ; 
3° le nombre zéro est neutre pour l’addition dans N, 
puisque, quel que soit l’entier naturel x, on a toujours 
x + 0 = 0 + x = 0. 


Loi de composition interne sur (addition). Le 
produit cartésien f^* x N* est composé de tous les 
couples (a, b) d’entiers naturels (le zéro n’a pas été 
indiqué, puisqu’il n’appartient pas à N*, mais à N). 
Les nombres écrits en noir sont les éléments de 
N* x ; chacun de ces éléments, à l’intersection 
d’une ligne et d’une colonne, est la somme de deux 
entiers non nuis. L’opération qui permet de trouver 
cette somme est l’addition. Si l’on ajoute à N* le 
nombre zéro, noté 0, tel que pour tout a E. N* 
0+ a = a + 0= 0 , alors on construit le monoïde 
(N, +, 0). 




Hermann Grassmann (1809-1877), mathématicien 
allemand, auteur de travaux fondamentaux sur la 
géométrie à n dimensions et sur ce qu’il a nommé 
!’« algèbre extérieure » (Ausdehnungslehre, 1862). 


— Le triplet (N, x, 1) est un monoïde. En effet : 
1° 1^1 est un ensemble non vide ; 2° la loi de composi¬ 
tion interne notée « x » est la multiplication usuelle : 
elle est associative en vertu des propriétés des entiers 
naturels ; 3° 1 est l’élément neutre pour la multiplica¬ 
tion dans M, puisque 1 x a = a x 1 = a. Notons au 
passage que, lorsqu’il n’y a pas de confusion possible, 
la loi de composition interne a x b peut se noter ab ou 
a . b. 

— Les triplets (Z, +, 0) et (Z, x, 1) sont aussi des 
monoïdes : 1° Z est un ensemble non vide ; 2° les lois 
de composition interne « -T » et « x » (addition et 
multiplication) sont associatives en vertu des proprié¬ 
tés des entiers ; 0 est neutre pour l’addition dans Z et 1 
est neutre pour la multiplication dans Z. 

• Monoïde des substitutions. Les substitutions 
ont été définies p. 35. Par exemple si E = { a, b }, il y 
a quatre substitutions possibles, que nous noterons 
s i, s 2 , s 3 et s 4 et qui sont les suivantes : 

— la substitution identique qui change {a, b} 
en { a, b }, c’est-à-dire qui applique a sur a et b sur b ; 
on l’écrit : 



en inscrivant en haut l’ensemble de départ et en bas 
l’ensemble d’arrivée. 

— Les autres substitutions possibles sont : 



1 - L’ensemble : 

S(E) = {s„ s 2 . s 3 , s 4 } (5) 

est Y ensemble des substitutions associé à l’ensem¬ 
ble E ; c’est un ensemble non vide. 

2 - L’opération produit définie p. 35, est une 
opération associative, qui admet comme élément 
neutre la substitution identique s-1. Nous l’indiquerons 
par le symbole « x ». La table de multiplication des 
substitutions dans E s’établit en examinant tous les 
produits Si x s y possibles. On obtient : 


$3 

s 4 

s 3 

S 4 


donc l’ensemble S(E) est un monoïde : on 
monoïde des substitutions de E. 


l’appelle 
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STRUCTURE DE GROUPE 

3 - Si E contient n éléments, on démontre aisé¬ 
ment que l’ensemble des substitutions est aussi un 
monoïde. 

• Ordre d’un monoïde. On appelle ordre d’un 
monoïde le nombre d’éléments qu’il contient (son 
cardinal). Le monoïde est dit fini quand il contient un 
nombre fini d’éléments (ce qui n’est pas le cas pour les 
exemples donnés à partir de N et Z ci-dessus). 

Structure de groupe. 

• Définition. Un groupe est un monoïde dont 
tous les éléments sont symétrisables pour l’opération 
définissant le monoïde. Explicitons cette définition. 

— Puisqu’un groupe est un monoïde, il peut être 
défini par le triplet (G, X, e), introduit au paragra¬ 
phe a : l’ensemble G est non vide, X est une opération 
binaire associative (mais pas nécessairement commu¬ 
tative) et e est l’élément neutre pour cette opération. 

— Dire que tous les éléments x d’un groupe G 
sont symétrisables, cela revient à dire que, pour tout 
x G G il existe un élément x' tel que : 

xx' = x' x = e , ( 6 ) 

comme on l’a expliqué ci-dessus, p. 37. 

— Si la loi X est commutative, le groupe est dit 
commutatif ou encore abélien (en hommage au nom 
du mathématicien norvégien N. H. Abel). 

— Un groupe qui contient un nombre n fini 
d’éléments est dit groupe fini d’ordre n. 

• Notation. Un groupe se désigne habituelle¬ 
ment par la lettre G ou par le triplet (G, X, e) qui sert à 
le définir. La loi X peut être notée multiplicativement à 
l’aide du signe « x », et le groupe est dit multiplicatif ; 
elle peut être aussi notée additivement, à l’aide du 
signe « + » et le groupe est dit additif. Si le groupe est 
multiplicatif, l’élément neutre est noté 1 , et le symétri¬ 
que d’un élément x quelconque est noté x -1 . Si le 
groupe est additif, l’élément neutre est noté 0 , et le 
symétrique d’un élément x quelconque est noté - x. 
Comme on l’a expliqué p. 38, on dit encore que 
l’élément x -1 est l’inverse de x, et que — x est 
l’opposé de x. 

• Exemples. 

— (Z, +, 0) est un groupe additif commutatif : 
1° Z est l’ensemble non vide des entiers relatifs ; 
2° l’opération « 4- » est l’addition des entiers, elle est 
associative ; 3° zéro est l’élément neutre pour l’addi¬ 
tion dans Z ; 4° chaque entier x admet un opposé — x 
tel que : 

(x) + (- x) = (- x) + (x) = 0 . ( 7 ) 

Donc le monoïde (Z, +, 0) possède la structure de 
groupe. Comme l’addition des entiers est commutative 
(en vertu de la définition axiomatique des entiers), on 
peut préciser qu’il s’agit d’un groupe abélien. 

— Le triplet (<□*, x, 1) définit un groupe multipli¬ 
catif : 1 ° < 0 * est l’ensemble non vide des nombres 
rationnels différents de zéro ; 2 ° l’opération « x » est la 
multiplication usuelle, qui est associative ; 3 ° le 
rationnel 1 est l’élément neutre pour la multiplication 
dans Q* ; 4° à tout xEÛ*on peut associer son inverse 
x -1 tel que : 

xx -1 = x -1 x = 1 . ( 8 ) 

(L’inverse du nombre a est 1/a ; l’inverse de la fraction 
a/b. est b/a.) 

— Le triplet (IR*, x, 1) définit un groupe multipli¬ 
catif : 1° [R* est l’ensemble non vide des réels diffé¬ 
rents de zéro (voir la définition des réels p. 31 et 
p. 53) ; 2° la loi de composition interne « x » est la 
multiplication des réels, c’est une opération associa¬ 
tive ; 3° le réel 1 est neutre pour la multiplication dans 
(R* ; 4° tout réel x G [R* admet un inverse x -1 . 

— Le triplet ((R 3 , 4-, 0) définit un groupe additif : 
1° IR 3 est le produit cartésien R x R x IR, c’est-à-dire 
l’ensemble des triplets (x, y, z) de nombres réels ; 2 ° la 
loi de composition interne « + » est I addition dansU 3 , 
définie (arbitrairement à l’aide d’axiomes) par : 

(x, y, z) + (x', y', z') = [(x + x'), (y 4- y'), (z 4- z')] ; (9) 

3° cette opération est associative et commutative ; 
4° l’élément neutre pour l’addition dans IR 3 est l’élé¬ 
ment 0 = (0, 0, 0) ; 5° le symétrique de chaque élément 
(x, y, z) est (- x, - y, - z). 

Pour les lecteurs qui ont quelques notions de mathé¬ 
matiques et de physique, le groupe (IR 3 , +, 0) est le 
groupe des vecteurs géométriques à trois dimensions ; 
(x, y, z) sont les composantes du vecteur ; l’opération 
« + » est la règle du parallélépipède, utilisée pour 
construire la résultante de trois vecteurs. 

— Voici maintenant un exemple géométrique. 
Soit O un point fixe du plan, et considérons la rotation 
d’angle 0 autour de ce point qui transforme un point A4 


quelconque en un point A4' ; nous appellerons r(0, 0 ) 
cette rotation et nous écrirons, en sous-entendant le 
point O : 

(a) 

A4-^-»A4'. (10) 

Soit E l’ensemble des rotations ainsi défini. Nous 
appelons produit de deux rotations ( 0 ^ et ( 0 2 ) l’appli¬ 
cation successive de la rotation (0.,) au point A4 et de la 
rotation (0 2 ) au point A4' ainsi obtenu. Le produit 
(0^-L (0 2 ) correspond donc à : 

(ii) 

Il est aisé de démontrer qu’on peut passer de A4 à A4" 
par la rotation d’angle 0 3 = 0 1 4- 0 2 . Nous écrirons : 

(0 1 )X(0 2 ) = (0 3 ). (12) 

Bien noter que (00, écrit avec les parenthèses, 
désigne une rotation, et que 0 1t sans parenthèses, est 
l’angle caractérisant cette rotation. L’élément neutre 
pour le produit Jl est la rotation (0) d’angle 0 = 0, et 
chaque rotation ( 0 ) possède un symétrique (- 0 ), 
puisque : 

(0) -L (— 0) = (— 0) -L (0) — (0) ; (13) 

donc l’ensemble E des rotations est un groupe pour le 
produit de deux rotations, défini par le triplet 
(E,. L,(0)). 

L’opération (13) nous suggère d’utiliser la notation 
additive X = 4- ; on écrira donc le produit de deux 
rotations sous la forme : 

(0i) + (0 2 ), (14) 

sans se laisser leurrer par le mot « produit » : nous 
dirons donc que l’ensemble des rotations autour d’un 
point O dans le plan est un groupe additif. 


M 



Rotations. 

La rotation (O, 0J applique M sur A4 ' ; la rotation 
(O, 0 2 ) applique A4' sur A4". La rotation (O, d 1 + d 2 ) qui 
applique A4 sur A4" est le produit de ces deux rota¬ 
tions. 


• Sous-groupe d’un monoïde. Considérons un 
monoïde A4, défini par le triplet (A4, _L, e), et, dans ce 
monoïde, l’ensemble des éléments symétrisables, que 
nous désignons par t/ 1f u 2 , u 3 , ... Cet ensemble est un 
sous-monoïde , puisque c’est une partie de A4. Nous le 
noterons U{M). Si, de plus, le composé u^ _L u 2 appar¬ 
tient à U(M) quels que soient u 1 et u 2 , alors U(M) a une 
structure de groupe : nous dirons que c’est un 
sous-groupe du monoïde A4 et nous l’appelons le 
groupe des éléments symétrisables de A4 ou groupe 
des unités de A4. 

Par exemple la structure A4 = (Z, x, 1 ) est un 
monoïde ;, les seuls éléments symétrisables pour l’opé¬ 
ration « x », c’est-à-dire les seuls entiers relatifs possé¬ 
dant un inverse entier, sont - 1 et + 1 ; donc : 

U( A4) -= {1, — 1 } • (15) 

• Groupe symétrique d’un ensemble. Soit 
A4 = S(E) le monoïde des substitutions d’un ensemble 
non vide E, que nous avons défini ci-dessus, à la fin du 
paragraphe C, a. Les éléments symétrisables qu’il 
contient constituent un groupe U(M) appelé groupe 
symétrique de E et noté Sym E. En particulier, si 
E = { a, b, c, ..., m }, on écrit : 

Sym E = E n (16) 

et on le nomme groupe de substitution sur n éléments. 
Chaque élément de E n est une permutation de l’ensem¬ 
ble E ; E n contient donc n ! éléments : c’est un groupe 
d’ordre n. 

Isomorphisme. 

Tout ce qui précède est bien abstrait, et il est temps 


de souligner l’intérêt de la notion de groupe. Les 
quelques exemples que nous avons donnés montrent 
que les entiers positifs, les réels positifs, les rotations 
dans le plan, les substitutions des éléments d’un 
ensemble ont une structure de groupe pour des lois de 
composition interne définies. Si donc nous établissons 
les propriétés générales des groupes, nous les aurons 
établies par là même pour tous les ensembles qui 
viennent d’être cités et pour beaucoup d’autres 
encore : il y a là une économie de démonstration 
appréciable. Par ailleurs, des groupes d’éléments très 
dissemblables peuvent être en fait rapprochés grâce à 
la notion très féconde d 'isomorphisme, définie d’une 
manière générale p. 38 et que nous allons maintenant 
exploiter. 

• Deux monoïdes (E, ±,e) et (E f , ±',e') sont 
dits isomorphes s’il existe une application f bijective 
de E sur E' telle que, pour tout x, y G E on ait : 


f(e) = e' ; 

f(x X y) = f(x) x' f(y). 


(17) 


Bien entendu, cette définition est aussi valable si les 
monoïdes sont des groupes. 

• Exemple. Considérons les deux groupes 
(IR, +, 0) et (R + , x, 1 ) dont les éléments sont des nom¬ 
bres réels. Le premier est un groupe pour l’addition et 
le second un groupe pour la multiplication. Considé¬ 
rons l’application x-^—»e x , qui fait correspondre à 
chaque x G IR la fonction exponentielle f(x) = e x G IR + 
(e est un nombre transcendant qui sera défini en 
Analyse et dont la valeur approchée est e = 2,718 281 8 
... ; donc e x est toujours positif, quel que soit x G R). On 
a, d’après les règles du calcul sur les exposants : 

r f( 0) = e° = 1 ; 

[ f{x + y) = e x+y = e x e y = f(x) x f(y). (18) 

Autrement dit les conditions (17) sont vérifiées : 
l’application x—^->e x est un isomorphisme. 

• Théorème de Cayley. Tout monoïde est iso¬ 
morphe à un monoïde de substitution ; tout groupe est 
isomorphe à un groupe de substitution. Ce résultat, dû 
à Cayley, est très important : il permet d’obtenir tous 
les monoïdes (tous les groupes) de la classe des 
monoïdes (ou des groupes) de substitutions. 


Sous-groupes. 

• Définition. Une partie A d’un groupe G est 
dite sous-groupe de G si A est un groupe pour 
l’opération X définie sur le groupe G. 

• Exemples. La notion de sous-groupe est une 
notion « à tiroirs ». Considérons par exemple le 
sous-groupe des nombres pairs (P, 4-, 0) pour l’addi¬ 
tion ; c’est un sous-groupe du groupe additif (Z, +, 0), 
qui est lui-même un sous-groupe du groupe additif 
(Q, 4-, 0), sous-groupe du groupe additif (R, T, 0), 
sous-groupe du groupe additif (C,+, 0 ), C désignant 
l’ensemble des nombres complexes. 

• Remarques : 

1 - Pour que A soit un sous-groupe de G, il faut 
que l’opération X considérée soit la même dans les 
deux ensembles. Ainsi les réels positifs R + sont un 
sous-ensemble des réels R, mais le groupe (R + , x, 1 ) 
n’est pas un sous-groupe du groupe (R, +,0), car les 
deux groupes sont définis pour deux lois de composi¬ 
tion différentes (x et +). 

2 - Le sous-ensemble { e} composé de l’élément 
neutre du groupe G est un sous-groupe de G et de 
tous les sous-groupes de G. On le nomme sous-groupe 
unité. 

• Sous-groupes cycliques. Considérons un 
groupe G noté multiplicativement, et un élément a 
appartenant à G. On note a 2 le composé a x a, a 3 le 
composé a x a x a, ..., a n le composé formé de n 
facteurs axaxax-*-xa. Nous conviendrons en 
outre que a 0 = 1 (élément neutre pour l’opération 
« x »). Avec ces définitions, on peut établir les règles 
de calculs sur les exposants : 

la a -a a -a , 

|(a n ) m = a nm . 

Soit maintenant l’ensemble des puissances de a, que 
nous noterons (a) : 

< a) = {1, a, a 2 .a"" 1 }. (20) 

On montre que ( a) est un sous-groupe, qu’on 
appelle sous-groupe cyclique de G engendré par l’élé¬ 
ment a (si le groupe G est additif, l’opération est 
notée +, et les puissances de a sont remplacées par les 
multiples de a : 0 , a, 2 a,..., /ca ; le sous-groupe cycli¬ 
que contient zéro et les multiples de a). 
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Enfin, un groupe G est dit lui-même cyclique s’il 
coïncide avec ses sous-groupes < a) ; l’élément a est 
dit générateur du groupe considéré. Tout groupe 
cyclique est commutatif. 


Décomposition d'un groupe suivant son sous-groupe. 

• Produit des sous-ensembles d’un groupe. Soit 
A, B, C, ... les sous-ensembles d’un groupe G, dont la 
loi de composition interne est notée multiplicative¬ 
ment. Pour tout a El A et pour b E B il existe un 
composé x = ab qui appartient au groupe G : l’ensem¬ 
ble de tous les éléments x de G représentables par le 
composé ab est le produit AB des sous-ensembles A 
et B pour l’opération considérée. Comme la loi de 
composition interne est associative, on a : 

(. AB)C = A(BC). (21) 

Si A ne contient que le seul élément a, le produit AB 
se réduit à aB et le produit BA à Ba (la loi de 
composition interne n’est pas nécessairement commu¬ 
tative, donc aB n’est pas nécessairement égal à Ba). Le 
diagramme ci-dessous est une image du produit AB. 



Image du produit AB de deux sous-ensembles d’un 
groupe. Le groupe G est représenté par la surface à 
fond gris ; ses éléments sont figurés par 
des points noirs, bleus ou rouges. Les sous-ensem¬ 
bles A et B sont composés de points bleus distincts. 
La loi de composition interne définissant le groupe, 
appliquée à deux points bleus appartenant l’un à A et 
l’autre à B donne un point rouge (on a représenté 
deux compositions particulières à l’aide de pointillés 
partant des deux éléments bleus composés et abou¬ 
tissant aux composés rouges). L’ensemble AB des 
points rouges est le produit des sous-ensembles A 
et B. 


• Classes d’équivalence dans un groupe. Soit 
maintenant A un sous-groupe de G (attention : tout 
sous-ensemble de G n’est pas nécessairement un 
sous-groupe, mais tout sous-groupe de G est un 
sous-ensemble de G) et x un élément de G. On appelle 
classe d’équivalence à gauche du groupe G modulo A 
(= selon le sous-groupe A) engendrée par l’élément x 
le produit xA, défini comme ci-dessus. On définit de 
même la classe d’équivalence à droite Ax. Si le groupe 
est abélien, c’est-à-dire si la loi de composition interne 
est commutative, les deux classes coïncident : 

xA = Ax. (22) 

1 - A étant un sous-groupe de G contient l’élé¬ 
ment neutre e (c’est-à-dire l’unité 1 pour un groupe 
multiplicatif). Comme xe = x, l’élément x appartient 
donc à la classe xA. 

2 - Pour tout y E xA, on a yA = xA : donc la 
classe d’équivalence à gauche peut être engendrée par 
n’importe quel élément de la classe. 

3 - Il en résulte que deux classes d’équivalence 
à gauche selon un sous-groupe A soit coïncident, soit 
sont disjointes. 

4 - Les propositions précédentes sont aussi 
vraies pour la classe d’équivalence à droite Ax. 

On peut donc décomposer un groupe G en classes 
d’équivalence (à gauche et à droite) modulo A qui sont 
disjointes deux à deux : on dit que G est décomposé à 
gauche ou à droite selon son sous-groupe A. Si l’opé¬ 
ration définissant le groupe est commutative, c’est-à- 
dire si le groupe est abélien, les deux décompositions 
coïncident : on parle de la décomposition du groupe 
abélien G selon son sous-groupe A tout court. 

Dans le cas où G est un groupe fini d’ordre n, 
l’ordre k de tout sous-groupe A de G est un diviseur 
de n (théorème de Lagrange). 

• Homomorphismes. 

— Si les décompositions à gauche et à droite 


selon un sous-groupe A de G coïncident, A est dit 
sous-groupe invariant (ou distingué) de G. C’est le cas, 
par exemple, de tous les sous-groupes d’un groupe G 
abélien (mais il peut exister des sous-groupes inva¬ 
riants dans des groupes non commutatifs). 

— Soit deux classes d’équivalence modulo A, 
xA et yA dans un groupe G. Chaque classe d’équiva¬ 
lence peut être interprétée comme un sous-ensemble 
de G, donc on peut définir le produit xA x yA comme 
ci-dessus (produit des deux sous-ensembles d’un 
groupe). On montre que si A est un sous-groupe 
invariant, le produit xA x yA = xyA est encore une 
classe d’équivalence modulo A. Cette classe est appe¬ 
lée groupe quotient G/A du groupe G par A. On 
montre que si G est abélien, G/A est abélien, et que si 
G est cyclique, G/A est lui-même cyclique. 

— Soit l’application <p : G G' appliquant G 
sur G' de telle sorte que à tout élément a de G 
corresponde un élément a' = acp bien défini de G'. Si, 
pour tout a', il existe un élément de G tel que a' = a<p et 
si, pour tout couple a et b d’éléments dans G on a : 

(ab) (p = a<p x b(p , (23) 

l’application est un homomorphisme. Si, de plus, <p 
est bijective, c’est un isomorphisme. Le développe¬ 
ment de l’algèbre linéaire a mis en évidence le rôle 
important des homomorphismes ; nous retrouverons 
cette application et nous en préciserons les particulari¬ 
tés en temps utile (voir p. 52). 

Conclusion. 

Le profane qui a parcouru l’exposé qui précède est 
peut-être déconcerté. Si sa formation mathématique 
élémentaire, au lycée, au collège, ou à l’école primaire, 
est antérieure aux années 1950-1960, il se pose sans 
doute la question suivante : « Je croyais que l’algèbre 
avait comme but essentiel de résoudre des équations, 
en utilisant les règles du calcul dit algébrique. A quoi 
correspondent les abstractions qui précèdent eu égard 
à ce problème ? » 

Nous lui répondrons, comme on l’a expliqué dans 
l’introduction historique p. 36, que, depuis environ un 
siècle et demi, l’algèbre (celle des mathématiciens et 
non pas celle des programmes scolaires d’une période 
encore récente) a changé de « but ». Elle est devenue 
l’art de combiner les éléments d’un ensemble quel¬ 
conque selon des lois de composition interne ou 
externe elles-mêmes quelconques. Le « calcul algé¬ 
brique » et son aboutissement, la résolution des 
équations, sont des cas particuliers de cette combina¬ 
toire dont les règles dépendent de la structure de 
l’ensemble considéré. Et si ces règles semblent plus 
difficiles à comprendre, plus abstraites que les règles 
du calcul « ordinaire », elles méritent cependant qu’on 
fasse l’effort de les assimiler et d’abord de bien saisir 
les définitions proposées. Car le calcul « ordinaire », si 
commode et si simple quand il s’agit de résoudre des 
équations du premier, du deuxième, du troisième ou 
même du quatrième degré, ou encore quand il s’agit 
d’étudier, en analyse, les propriétés de quelques fonc¬ 
tions élémentaires, se révèle bien vite un outil insuffi¬ 
sant quand les problèmes se compliquent. C’est alors 
que l’algèbre des structures, et en particulier la théorie 
des groupes, prend avantageusement le relais et que 
bien des problèmes restés sans réponse ou impossi¬ 
bles à traiter jusqu’aux environs de 1850/1860 ont 
trouvé leur solution grâce aux progrès incessants des 
algèbres abstraites et de l’algèbre linéaire, étudiées 
p. 58. Contentons-nous simplement de souligner ici 
que c’est l’idée du groupe de substitutions des n 
racines d’une équation du n-ième degré qui a mis 
Évariste Galois sur la voie royale de la théorie des 
groupes, théorie qui permet de résoudre des quantités 
de problèmes touchant à la théorie des nombres, à la 
géométrie, à la topologie, etc. 

Enfin, si les raisonnements abstraits vous effrayent, 
retenez au moins les points suivants : 

1 - la définition d’un groupe (G, _L, e) donnée 

p. 40 ; 

2 - la notion de sous-groupe A d’un groupe G ; 

3 - la théorie des groupes de substitutions, et en 
particulier le fait que le groupe symétrique de n objets 
S n contient n ! substitutions possibles. 

Structure d'anneau. 

La structure d’anneau a été introduite par Dedekind, 
dont les travaux fondamentaux datent de 1872 (sur les 
irrationnels), de 1888 (Was sind und was sollen die 
Zahlen : Ce que sont et ce que doivent être les 
nombres), et de 1879-1888 (sur les nombres algébri¬ 
ques). Le mot « anneau » a été introduit par Hilbert 
(1897) ; Dedekind appelait les anneaux « ordre ». On 
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notera qu’il s’est écoulé environ 50 à 60 ans, soit deux 
générations de mathématiciens, entre l’introduction de 
la structure de groupe, par Galois, et la théorie des 
anneaux. 

Définition. 

La structure de groupe était définie par une opéra¬ 
tion seulement, d’où la notation (G, X, e) : un groupe 
est une structure algébrique. Nous allons maintenant 
définir une structure à deux opérations (E, X, T, e, e'), 
c’est-à-dire une algèbre, au sens non technique défini 
p. 39. 


• Définition générale. Le quintette (E, X, T, e, 
e’) est un anneau si : 

1 ~(E, X, e) est un groupe abélien ; 

2 - (E, T, e') est un monoïde ; 

3 - les opérations X et T sont doublement distri¬ 
butives ; pour tout x, y, z E E, on a : 

JxT(y_L z) = (xTy)_L (xTz) ; m 

|(ylz)Tx = (yTx)l(zTx). ' ’ 

• Remarques et notation. 

1 - L’opération X est associative (elle définit un 
groupe) et commutative (le groupe doit être abélien). 
Nous la noterons additivement à l’aide du signe « + » ; 
l’élément neutre e sera noté 0 et le symétrique de x 
dans E sera noté - x. Si E est un ensemble numérique, 
+ et 0 ont la signification arithmétique usuelle, sinon 
l’opération + et l’élément 0 doivent être définis axio- 
matiquement. 

2 - L’opération T est associative (elle définit un 
monoïde), mais elle n’est pas nécessairement commu¬ 
tative. Cette opération sera notée multiplicativement, à 
l’aide du signe « x », l’élément neutre e' sera noté 1. Il 
n’est pas nécessaire de prévoir une notation pour le 
symétrique (l’inverse) de x, puisque la loi de composi¬ 
tion interne T ne définit pas un groupe, mais un 
monoïde. 

Le groupe (E, X, e) sera donc noté (E, +, 0), et le 
monoïde (E, T, e') sera noté (E, x, 1). Quant à la loi de 
distributivité (1), elle s’écrira : 

| x(y + z) = xy + xz ; 

\(y + z) x = yx + zx . 

3 - La définition de la structure d’anneau don¬ 
née ici est celle proposée par l’algébriste américain 
Nathan Jacobson. Dans de nombreux traités d’algèbre, 
cette structure est définie sans imposer d’élément 
neutre e' pour la deuxième loi de composition interne. 
Dès lors un ensemble E est un anneau : 1° si (E, X, e) 
est un groupe ; 2° si (E, T) est un ensemble simple¬ 
ment muni d’une opération associative (un tel ensem¬ 
ble est appelé un semi-groupe) ; 3° si X’ et T sont 
doublement distributives. 

4 - Avec deux opérations associatives au lieu 
d’une seule, la structure d’anneau est plus riche que 
celle de groupe. Si l’on veut une comparaison : un 
groupe est assimilable à un joueur de tennis qui ne 
saurait exécuter que des coups droits ; un anneau 
correspondrait à un joueur qui saurait, en outre, faire 
des revers. Ce deuxième joueur aurait évidemment un 
jeu plus varié et plus spectaculaire que le premier. 

• Exemples numériques. 

— L’ensemble Z des entiers relatifs, muni des 
opérations + et x classiques, et comprenant les élé¬ 
ments neutres respectifs 0 et 1 est un anneau. En 
effet : 

1 - (Z, +, 0) est un groupe ; 

2 - (Z, x, 1) est un monoïde ; 

3 - l’addition et la multiplication des entiers sont 
des opérations mutuellement distributives. 

— Considérons l’ensemble Q des rationnels, 
muni des lois de composition interne + et x usuelles. 
Q est un ensemble non vide qui répond aux caractères 
suivants : 

1 - les opérations + et x sont définies pour tout 
couple x, y E Q ; 

2 - l’opération + admet 0 comme élément neu¬ 
tre ; l’opération x admet 1 comme élément neutre ; 

3 - les opérations + et x sont toutes deux 
associatives, commutatives et réciproquement distri¬ 
butives ; 

4 - tout x EQ admet un symétrique - x pour la 
loi de composition interne + et un symétrique 
x -1 = 1/x pour la loi de composition interne x. 

Par conséquent: 1° (Q, +, 0) est un groupe; 
2° (Q, x,1) est aussi un groupe, donc, a fortiori, un 
monoïde ; 3° la loi de double distributivité est vérifiée. 
Donc l’ensemble Q des rationnels a une structure 
d’anneau. Notons que c’est un anneau très riche, 
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puisque la deuxième opération possède des propriétés 
non obligatoires dans la structure d’anneau (nous 
verrons plus loin que l’anneau Q est, en fait, un corps). 

— Considérons l’ensemble E des nombres de la 
forme m + n V2, m et n étant des entiers relatifs, muni 
des opérations + et x. 

1 - Observons d’abord que si l’on fait m= n = 0, 
on a m + n V2 = 0 : donc 0 G E. De même, si m = 1 et 
n = 0, on a m + n V2 = 1, donc 1 appartient aussi à E. 

2 - Les lois de composition + et x sont associa¬ 
tives, commutatives et doublement distributives. 

3 - La somme de deux éléments de E est un 
élément de E : 

(m + n V 2 ) + (m' + n' V2) 

= (m + m ) + (n +n ) V2 = a + b V2. (3) 

Comme a = m + m' et b = n + n' sont des entiers, le 
nombre a + b V2Œ E. 

4 - Le produit de deux éléments appartenant à E 
est un élément de E : 

(m+ nV2){m’ + n’ V2) 

= (mm' 4- 2 nn’) + (mn' + nm') \f2. (4) 

5-0 et 1 sont respectivement neutres pour 
l’addition et la multiplication. 

6 - Tout élément (m + n V2) admet un symétri¬ 
que pour l’addition : - m - n VZ 
Donc: 1° (E, +, 0) est un groupe abélien ; 

2° (E, x, 1) est un monoïde ; 3° la loi de double distri¬ 
butivité est vérifiée. L’ensemble E est donc un anneau. 
On peut préciser un anneau numérique abélien , puis¬ 
que ses éléments sont des nombres et que la deuxième 
opération est elle aussi commutative. 

• Un exemple ... électrique. Considérons un 
circuit électrique comprenant n contacts, qui peuvent 
être ouverts (le courant ne passe pas) ou fermés (le 
courant passe). Pour décrire ce circuit, nous devons 
préciser quels sont les contacts ouverts et quels sont 
les contacts fermés. Pour cela, convenons de faire 
correspondre le symbole 0 à un contact ouvert et le 
symbole 1 à un contact fermé. Appelons a, b , c, ..., n 
les contacts, et x un contact quelconque ; nous décri¬ 
rons le circuit à l’aide du tableau suivant, en appelant 
f{x) la valeur 0 ou 1 attribuée à un contact x quel¬ 
conque : 


X 

a b c d 

... n 

f{x) 

0 110 

... 1 


(L’exemple est arbitraire.) Par exemple le nombre : 

01101000111010111 

décrit un circuit à 17 contacts et signifie : le premier 
contact est ouvert ; le second est fermé ; le troisième 
est fermé ; le quatrième est ouvert ; le cinquième est 
fermé ; le sixième, le septième et le huitième sont 
ouverts ; le neuvième, le dixième et le onzième sont 
fermés ; le douzième est ouvert ; le treizième est 
fermé ; le quatorzième est ouvert ; le quinzième, le 
seizième et le dix-septième sont fermés. Dans la nota¬ 
tion numérique (dite aussi notation binaire, car elle 
n’utilise que deux signes), il nous a fallu 17 caractères 
d’imprimerie pour décrire l’état du circuit ; avec la 
notation écrite qui la traduit, nous avons eu besoin de 
300 caractères. Voilà qui doit nous encourager à nous 
familiariser avec la notation binaire. Signalons dès 
maintenant qu’elle ne permet de transcrire que deux 
situations : le courant passe ou il ne passe pas, sans 


Montage en dérivation. 

Les quatre valeurs possibles des contacts a et b 
sont : 

I- a = b = 1. Il - a = 1, b = 0. 

III- a = 0, b = 1. IV - a = b = 0. 



qu’il y ait de troisième solution possible. La notation 
binaire traduit le tout (=1) ou rien (= 0). 

— Soit x la valeur d’un contact ; s’il est ouvert, 
x = 0. Fermons-le : il prend la valeur x' = 1. Ouvrons le 
contact x' = 1 : il prend la valeur (x')' = 0. Un couple de 
valeurs (x, x') sera dit symétrique. Les deux seuls 
couples possibles de valeurs symétriques sont (1,0) et 
( 0 , 1 ). 

— Montage en dérivation : considérons un cir¬ 
cuit comprenant deux contacts disposés en dérivation. 
La figure précédente indique toutes les dispositions 
possibles. 

Il est clair que la dérivation à deux contacts est 
équivalente à un contact unique c, qui aurait la 
valeur 1 dans tous les cas où le courant passe de Z à 
Z , c’est-à-dire dans les cas I, Il et III de la figure, et la 
valeur 0 dans le cas IV. La combinaison (a, b) est donc 
une loi de composition interne sur l’ensemble des 
contacts, opération que nous noterons « V » : 

a V b = c. (5) 

(V est l’initiale du mot latin Vel = « ou » : pour que 
c = 1, il faut et il suffit que l’un ou l’autre des contacts 
a et b soit fermé, c’est-à-dire ait pour valeur 1). 

La table de la loi de composition interne V peut donc 
s’écrire comme suit : 


b 


V 

1^ 

0 

J 1 

1 

1 

1 0 

1 

0 


Table pour la loi de composition interne V : la 
valeur du composé a V b est à l’intersection de la 
ligne a et de la colonne b. Par exemple : 7 V 0 = 1. 


— Montage en série : le montage en série de 
deux contacts a et b est indiqué sur la figure ci-après. 
Il est équivalent à c = 1 si a et b sont fermés 
(a = b = 1), et à 0 dans tous les autres cas (il suffit 
qu’un des deux contacts soit ouvert pour que le 
courant ne passe plus). Le montage en série est donc 
une loi de composition interne que nous noterons « A » 
(c’est un V renversé) ; en voici la table : 

b 


V 

1 

0 

f 1 

1 

0 

1 0 

0 

0 


Table pour la loi de composition interne A. 


— En résumé, nous sommes amenés à considé¬ 
rer l’ensemble B = { 0,1 } muni des deux opérations V 
et A et de la définition de l’opération « ' » : x= 0, x' = 1 ; 
x = 1, x' = 0. 

1-11 est aisé de constater que l’opération V est 
associative, commutative (aVb=bVa), et qu’elle 
admet 1 pour élément neutre. D’autre part, puisque 
0' = 1 et 1 ' = 0 , on a 1 + 1 ' = 1 + 0 = 1 et 
0 + 0'= 0 + 1 =1 : donc tout élément de B={0,1} 
possède un inverse pour l’opération V. Le triplet 
(B, V, 1) est un groupe. 

2 - On démontrerait de même que (b,A,0) est 
un monoïde. 

3 - Les opérations V et A sont mutuellement 
distributives. 



I f (a) 1 f(b) 0 Z 

Montage en série. 


Donc l’ensemble B dont la structure est définie par 
le sextet (B, V, A, 1,0/) est un anneau. Nous verrons 
plus loin (p. 50) qu’on peut le qualifier de booléen (on 
dit aussi que c’est une algèbre de Boole), en hom¬ 
mage au logicien et mathématicien britannique George 
Boole. 

• Autres exemples. Parmi les ensembles dont 
on se sert usuellement en mathématiques, et que nous 
étudierons plus loin, certains ont une structure 
d’anneau, par exemple : 

— l’ensemble Z des entiers relatifs (anneau 
abélien), étudié p. 27 ; 


— l’ensemble des classes résiduelles modulo n 
(anneau abélien), étudié p. 29 ; 

— l’anneau des matrices carrées d’ordre n, 
anneau non commutatif très important qui sera étudié 

p. 62; 

— l’anneau des polynômes à une indéterminée ; 

— etc. 

Types d'anneaux. 

On obtient différents types d’anneaux en imposant 
des conditions supplémentaires au monoïde (E, T, e'). 

• Anneau commutatif. Si l’opération T est 
commutative, l’anneau est dit commutatif ou abélien 
(c’est le cas pour les enzembles Z, Q, IR, C par 
exemple). L’anneau des matrices carrées d’ordre n, en 
revanche, n’est pas commutatif. 

• Domaine d’intégrité. Si x^0 et y^0 impli¬ 
quent xy^O, l’anneau est appelé un domaine d’inté¬ 
grité. Cela signifie que l’ensemble E*, constitué de 
tous les éléments de E à l’exclusion de l’élément 
neutre e = 0, est un sous-monoïde du monoïde défini 
par (E, x,1). La définition d’un sous-monoïde est 
donnée p. 40. 

Les ensembles numériques Z, <0, IR et C sont des 
domaines d’intégrité ; cet énoncé traduit, dans ces 
ensembles, la propriété bien connue des collégiens : 
pour qu’un produit de facteurs ab soit nul, il faut et il 
suffit que l’un des facteurs soit nul. 

• Diviseurs de zéro. Si, dans un anneau E, on a 
à la fois a ^ o, b ^ 0 et ab = 0, a est appelé un diviseur 
de zéro à gauche (ou à droite si ba = 0). 

Dans un domaine d’intégrité, par exemple dans 
l’ensemble Z, le produit ab {ab ^ 0) est nul si, et 
seulement si, a est nul. Donc le seul diviseur de zéro 
est 0. Tout ensemble qui possède un ou des diviseurs 
de zéro différents de 0 n’est pas un domaine d’inté¬ 
grité. 

• Corps. Si nous imposons à la deuxième loi de 
composition interne la condition supplémentaire : tout 
élément a^0 de l’anneau E possède un inverse b 
dans E pour cette deuxième loi, l’anneau est appelé 
anneau de division ou corps. 

Par exemple : l’anneau Z n’est pas un corps, puisque 
l’égalité ab = 1 n’est possible que si a = b = 1. En 
revanche, l’anneau Q des nombres rationnels est un 
corps, puisque, à tout a ^0 il correspond un 
inverse a 1 tel que aa _1 = 1. L’étude des propriétés des 
corps est faite p. 43. 

• Algèbres non associatives. Un ensemble muni 
des axiomes de la structure d’anneau mais dont la 
deuxième opération n’est pas associative est une 
algèbre non associative {algèbre est pris au sens de 
« structure définie par au moins deux lois de composi¬ 
tion interne >>, et non en son sens technique usuel), ou 
encore un anneau non associatif. La plus simple des 
algèbres non associatives est l’ensemble des vecteurs 
géométriques à trois dimensions, muni des opérations 
nommées addition vectorielle (+) et produit vectoriel 
(x). Cette algèbre est très utile aux physiciens, qui 
représentent un certain nombre de grandeurs fonda¬ 
mentales par le produit vectoriel de deux vecteurs 
(ainsi les notions de moment résultant d’un système de 
forces ou d’un moment cinétique. 

Congruences. 

Nous avons déjà rencontré la notion de congruence 
dans Z, écrite sous la forme b = c (mod a), relation qui 
exprime que b - c est divisible par l’entier a. Nous 
allons généraliser cette notion. 

• Congruence dans un monoïde (ou dans un 
groupe). Soit (E, _L , e) un monoïde (voir la définition 
p. 39). Deux éléments a et a' de ce monoïde sont dits 
congruents, relation que nous représenterons par le 
symbole « = », si a = a' et b = b' entraînent a l} b = 
a' ±1 b'. En d’autres termes, une congruence est une 
relation d’équivalence qui peut être composée selon la 
loi jJ. 

L’ensemble de tous les éléments a' congrus à a dans 
E forme la classe d’équivalence à ; de même l’ensem¬ 
ble de tous les éléments b' congrus à b constitue la 
classe d’équivalence b ; etc. L’ensemble des classes 

d’équivalence : _ _ _ 

E = {a, b,...} 

est appelé ensemble quotient pour la relation = ; on 
écrit aussi E = E/=. Si le monoïde possède une struc¬ 
ture de groupe, alors chaque classe â possède un 
inverse à -1 , tel que ââ* 1 = e. 

Enfin rappelons les définitions suivantes : un 
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Isomorphismes. 


• Notion d’idéal. Considérons la structure (E, 
+, 0) de l’anneau E et soit / un sous-groupe de E, tel 
que, pour tout a E. E et pour tout b E /, on ait ab et 
ba E I. Le sous-groupe / est alors appelé un idéal de 
l’anneau E (quand on dit que / est un sous-groupe de 
E, on veut dire que c’est un sous-ensemble de E 
contenant l’élément neutre zéro et possédant une 
structure de groupe pour la loi +). 


Cette application joue un rôle très important dans la 
théorie des anneaux et dans celle des corps qui y est 
reliée. Comme on l’a dit p. 38, un isomorphisme est 
une application E — f —> E', bijective, telle qu’à tout 
couple (a, b) d’éléments de E corresponde un couple 
(a', b') dans E' et que les images dans E' de a _L b 
et de a T b soient a' ± b ' et a' T b', ou, si l’on utilise 
les notations additive et multiplicative telles que l’image 
de a + b soit a' + b' et celle de ab, a' b'. 

Alors l’image de 0, élément neutre pour l’opération + 
dans E, est 0', élément neutre pour la même opération 
dans E' ; et l’image de 1 est T, élément neutre dans E'. 
En conséquence le symétrique - a de a a pour image 
- a' dans E' ; l’inverse a -1 de a a pour image dans E' : 
a' -1 . Si un anneau E n’a pas de diviseur de 0, alors 
l’isomorphe E’ n’a pas de diviseur de 0. D’une manière 
générale, deux anneaux isomorphes E et E' peuvent 
avoir des éléments de nature différente, mais les 
opérations algébriques (combinatoires) sur leurs élé¬ 
ments sont les mêmes. 


Structure de corps. 


Comme la structure d’anneau, la structure de corps a 
été découverte par les mathématiciens du XIX e siècle 
dans le cadre des recherches sur la théorie des 
nombres, à l’origine desquelles se trouve Gauss. Les 
travaux de Kummer (entre 1850 et 1860), qui aboutis¬ 
sent à la notion de nombre algébrique, ouvrent la voie à 
ceux de Dedekind, à qui on doit l’introduction générale 
de la notion de corps ; ils furent complétés par l’œuvre 
axiomatique de Hilbert (1897). La théorie des corps a 
été aussi étudiée par G. Frobenius, A. Hurwitz, L. Kro- 
necker et H. Weber. 

Définition. 

La structure de corps s’obtient en complétant la 
structure d’anneau par l’axiome suivant : pour tout x 
appartenant à un anneau, et non neutre pour la 
première loi de composition interne, il existe un symé¬ 
trique (= inverse) pour la seconde loi définissant 
l’anneau. 

• Axiomes de la structure de corps. Récapitu¬ 
lons donc les axiomes de la structure d’anneau en lui 
ajoutant l’axiome précédent : nous obtenons les axio¬ 
mes de la structure de corps. 

1 - E est un ensemble non vide. 

2 - E est muni d’une loi de composition interne, 
partout définie, associative et commutative, notée X 
(ou, usuellement, +). 

3-11 existe un élément neutre e E E pour cette 
loi (ordinairement noté 0). 

4 - Tout x E E est symétrisable pour cette loi 
(ordinairement, le symétrique de x est noté — x et 
appelé « opposé de x »). 

5 - E est muni d’une deuxième loi de composi¬ 


Les circuits électriques des ordinateurs les plus sophistiqués (ci-dessus un circuit intégré ultrarapide, capable 
de réaliser 10 000 fonctions logiques élémentaires) sont des applications spectaculaires des algèbres 

booléennes. 


tion interne, partout définie, associative (mais pas 
nécessairement commutative), notée T (ou, ordinaire¬ 
ment, x). 

6-11 existe un élément neutre e' E E pour cette 
loi (ordinairement noté 1). 

7 - Pour tout x différent de e et appartenant à E, 
il existe un symétrique pour la deuxième loi de compo¬ 
sition (ordinairement, le symétrique de x est noté x -1 
et appelé inverse de x ; si la deuxième loi est 
commutative, on le note 1/x). 

8 - Les deux lois de composition sont double¬ 
ment distributives. 

• Remarques : 

1 - Si l’on impose à la deuxième loi d’être 
commutative, le corps est dit commutatif ; sinon, il 
s’agit d’un corps non commutatif. 

2 - Lorsque les éléments d’un ensemble ayant la 
structure de corps sont des nombres, le corps est dit 
numérique ; bien entendu, il existe des corps non 
numériques. 

3 - Un corps dont le nombre d’éléments est fini 
est un corps fini: nous en donnons un exemple 
important ci-après. 

• Exemple de corps commutatif. Pour démon¬ 
trer qu’un ensemble E possède la structure de corps 
commutatif pour les deux lois + et x, il suffit de 
démontrer: 1° qu’il possède la structure d’anneau 
commutatif ; 2° que tout élément x différent de 0 
appartenant à cet ensemble possède un inverse pour 
l’opération x. 

— L’anneau Z des entiers n’est pas un corps, 
car seul + 1 et - 1 ont un inverse pour la multiplication 
(I- 1 = 1 ; — i 1 = — 1), les autres entiers ne possédant 
pas d’inverses entiers. 

— L’anneau <Q> des rationnels est un corps, car 
tout xEÛ possède un inverse x -1 pour la multiplica¬ 
tion. L’anneau Q a été construit au n° 512.3, E, b , 
comme le produit cartésien Z x Z* : si a, b, c, ... 
désignent des entiers relatifs, un élément x E Q est 
représenté par un couple a/b d’entiers et son inverse 


x -1 = b/a (cet inverse est lui-même un entier dans le 
cas particulier où a est diviseur de b). 

— L’anneau IR des réels est un corps (voir 
ci-après, p. 54). 

— L’anneau € des complexes, c’est-à-dire des 
nombres de la forme a + bi, a et b étant des éléments 
de U et i étant défini par i 2 = - 1, est un corps (voir 
ci-après p. 55). 

— Si m, n E Q, les nombres tels que 
x = m + n V2 forment un corps. En effet, au paragra¬ 
phe D, a, nous avons démontré que l’ensemble de ces 
nombres avait une structure d’anneau pour m, n E Z ; 
le fait que m, n E O permet d’assigner un inverse 
x- 1 = 1/(m+nV2) à tout xEQ: donc l’ensemble 
considéré est un corps. 

• Un exemple de corps non commutatif. Soit 
l’ensemble H des nombres q défini par : 

q = a + b\ + c] + dk , (1) 

a, b et c étant des réels et i, j, k des symboles définis 
par : 

j2 = j2 = k 2 = jj k = _ -, (2) 

Les nombres q ressemblent aux complexes a + bi 
mais ils sont composés de quatre termes au lieu de 
deux ; on les nomme pour cette raison des quater- 
nions : ils ont été inventés par l’Irlandais W. R. Hamil- 
ton, en 1843. Signalons au passage que les quater- 
nions peuvent être appelés « nombres », non pas parce 
qu’ils servent à mesurer quelque chose (une grandeur 
géométrique commensurable ou incommensurable, 
une grandeur physique déterminée, ou toute autre 
chose), mais parce qu’ils sont susceptibles d’être les 
objets d’un calcul. 

— L’addition dans H est définie par : 

(a + bi + cj + d k) 4- (a' + b’ i + c' j + d' k) = 

= (a + a') + (b + b') i + (c + c') j + (cf + cf') k . (3) 

On voit que : 1° la somme de deux quaternions est 
un quaternion ; 2° l’opération est commutative, 

puisqu’elle concerne les réels a, b, c, d, a', b', c' et d'. 


sous-groupe K d’un groupe G est dit normal ou inva¬ 
riant si, pour tout g E G et pour tout k E K on a : 

g- 1 _L k X g E K , (6) 

que nous noterons multiplicativement sous la forme : 

g'kg EK. (7) 

• Congruence dans un anneau. Un anneau E 
possède la structure de groupe (E, +, 0) et la structure 
de monoïde (E, x, 1). Une relation qui est à la fois une 
congruence dans (E, +,0) et dans (E, x,1) est une 
congruence dans l’anneau E. Autrement dit, si a = a^ 
et b = b', alors a + b = a' -F b' et ab = a' b'. Si a et b 


désignent deux classes d’équivalence 
relation =, on aura : 

pour 

la 

fa + b = a + b ; 


(8) 

| ab = ab 


On montre aisément que les deux 

lois 

de 


composition + et_x sont doublement distributives, 
donc l’ensemble E des classes d’équivalence est un 
anneau pour la relation = ; on l’appelle anneau quo¬ 
tient de E, et on le note parfois : 

Ë = E/= . (9) 
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avec E = (ab ' + ba' + de' - cd')\ 

F = (ac' -t- ca' + bd' - db’) ; ( 8 ) 

G = (ad' + da' + cb' - bc'). 

Le corps des quaternions est donc un corps non 
commutatif. Nous rencontrerons d’autres corps non 
commutatifs en algèbre linéaire et dans bien d’autres 
branches des mathématiques. 


William Rowan Hamilton (1805-1865) est le plus 
grand mathématicien irlandais. Ses travaux sur 
l’optique et sur la dynamique sont très importants, 
mais il est surtout connu par sa théorie des quater¬ 
nions et par la création de la théorie des vecteurs. 


Corps finis. 

Un corps est dit fini s’il possède un nombre fini 
■§ d’éléments. Nous en avons rencontré un exemple en 
| théorie des nombres, en étudiant les classes résiduel- 
^ les modulo n dans Z (voir p. 28). Nous allons 
^ reprendre cet ensemble dans le cadre de la théorie 
des corps. 

• Constitution de l’ensemble Z/n. Soit n un 
S nombre entier différent de 1 , a et b deux entiers 
.g quelconques appartenant à Z et considérons la 
^ congruence : 

ï a = b (mod n). (9) 

J Cette relation exprime que a - b est divisible par n, 
ï ou encore que la division de a et de b par n donne le 
2 même reste. L’anneau Z des entiers est alors la réunion 
des n classes résiduelles modulo n suivantes : 

| — la classe C 0 = 0 des entiers dont le reste de la 

| division par n est 0 (ce^sont les multiples de n) ; 

5 — la classe C 1 = 1 des entiers dont le reste de la 

^ division par n est égal ^ 1 ; 

2 — la classe C 2 = 2 des entiers dont le reste de la 

| division par n est égal à 2 ; 

— etc. ; 

— la classe C n _ 1 = (n -1) des entiers dont le 
reste de la division par n est égal an- 1 . 

L’ensemble fini de ces n classes est noté Z/n : 

Z/n = {C 0 ,C 1 ,C 2 ,...,C n _ 1 }, (10) 


— Le quaternion q = 0, obtenu pour 
a = b= c = d = 0 , est neutre pour l’addition. 

— La multiplication dans H est définie d’une 
part par les règles de la multiplication des réels pour 
les coefficients a, a', etc., d’autre part par la table de 
multiplication des nombres i, j, k (il est traditionnel de 
souligner que Hamilton mit six ans avant de parvenir à 
rétablissement satisfaisant de cette table !) : 



Table de multiplication des symboles i, j, k dans 
l’algèbre des quaternions. 


D’après cette table, on voit que : 

f ij = ~ ji = k ; 

) jk = - k j = i ; (4) 

l ki = — ik = j. 

La multiplication ainsi définie est une opération 
associative, mais non commutative (par 
exemple : ij = - ji) ; l’élément neutre pour la multipli¬ 
cation est q= 1 . 

L’ensemble H des quaternions a donc une structure 
de corps. Les égalités (4) montrent que la multiplica¬ 
tion des quaternions n’est pas commutative, c’est-à- 
dire que le produit de deux quaternions dépend de 
l’ordre des facteurs : qq' ^ q' q. Le lecteur pourra s’en 
assurer en multipliant (a + bi + cj + d k) par 
(a' + b' i + c' j + d' k) et en refaisant la même multipli¬ 
cation après interversion des facteurs. On trouve en 
effet : 


(a + bi + cj + dk) (a' + b' i + c' j + d' k) = 

= A + B\ + Cj + Dk , (5) 

avec : 

A = (aa' - bb' - cc' - dd') ; 

B = (ab' 4- ba' + cd' - de') ; 

C = (ac' 4- ca' + db' - bd') ; ' ' 

D = (ad' 4- da' + bc' - cb'). 

et 

(a' + b' i + c' j 4 d' k) (a 4 bi + cj 4- dk) = 

= A + E\ + Fj 4 Gk , (7) 


qu’on écrit encore, avec la convention du surligne- 

ment : __ 

Z/n = {0,1,2,..., n-1}. 

Par exemple, si n = 3, on aura : 

C 0 = 0 = classe des entiers divisibles par 3 ; 

_ classe des multiples de 3 ; 

C 1 = 1 = classe des entiers qui sont des (mul- 
_ tiples de 3) + 1 ; 

C 2 = 2 = classe des entiers qui sont des (mul¬ 
tiples de 3) + 2 ; 

et l/ensemble Z/3 est un ensemble fini à 3 éléments {0, 

1 , 2 }. 

On peut calculer sur des classes comme on calcule¬ 
rait sur des nombres, en définissant deux lois de 
composition interne sur les éléments de l’ensemble 
Z/n, que nous nommerons addition et multiplication 
des classes. 


( 11 ) 


( 12 ) 


• Addition des classes. 

— Définissons l’addition de deux classes quel¬ 
conques Cj et Cj par : 


Ci 4- Cj - C i+j , 
c i 4- Cj= C i+i _ r 


si / + j < n ; 
si / + j 5 s n . 


(13) 


Avec la convention du surlignement, cette définition 
de l’addition s’écrirait : 


P~+y = / + /, 

[' + y = i + y - n , 


si i + j < n ; 
si / 4 j s* n . 


(14) 


Par exemple, avec n = 3, on aurait C 0 + = C-,, ce 

qui correspond à la propriété suivante : la somme d’un 
multiple de 3 et d’un (multiple de 3) + 1 est un (multiple 
de 3) + 1. De même C 2 + C 2 = C 4 _ 3 = C, : la somme de 
deux (multiples de 3) + 2 est un (multiple de 3) 4-1, etc. 

— Il est aisé de constater que l’addition des 
classes est une opération associative et commutative, 
puisque l’addition des entiers / et j est elle-même 
associative et commutative. 

— La classe C 0 = 0 est l’élément neutre pour 
l’addition des classes, puisque, quelle que soit la 
classe Cj, on a : 


C Q 4 Cj — Cj + C 0 — Cj. (15) 


En notation surlignée, l’égalité précédente s’écrirait : 

0 + /= 1 + 0 = 7 ( 16 ) 

— Chaque classe C, (ou T) G Z/n possède un 
symétrique dans Z/n qui est : 


C 7 1 


(17) 


Avec la notation surlignée, l’égalité (17) s’écrirait : 

r‘= n-i. (18) 


• Multiplication des classes. 

— Définition de la multiplication de deux clas¬ 
ses Cj et Cj par : 


CjXCj = C r , (19) 

r étant le reste de la division du produit ij par n. 
Par exemple, avec n = 3, on aurait : 


C 2 X c 2 = C r 

(20) 

et, comme ici ij = 4, r = 1, donc : 


C 2 x C 2 = C 1 . 

(21) 

En notation surlignée, on écrirait : 


2x2=T. 

(22) 


Les égalités (21) et (22) correspondent à la propriété 
suivante: le produit d’un (multiple de 3) + 2 par un 
(multiple de 3) + 2 est un (multiple de 3) + 1. 

— La multiplication des classes est commuta¬ 
tive, associative, distributive ; la classe C 1 = 1 est 
l’élément neutre pour la multiplication. 

• Conclusion. L’ensemble Z/n est donc un 
anneau (c’est un groupe pour l’addition et un monoïde 
pour la multiplication, comme on vient de le voir), et un 
anneau fini, puisque le nombre n de ses éléments est 
fini. Les propriétés de cet anneau sont différentes 
selon que n est ou n’est pas un nombre premier. 

— Si n n’est pas un nombre premier, Z/n 
possède des diviseurs de 0 (voir la définition p. 28), 
c’est-à-dire que l’on peut avoir à la fois C, # Ô, C y ^ Ô 
et Cj Cj = Ô, Ô étant l’élément neutre pour l’addition 
des classes. En effet, si n n’est pas premier, on peut 
l’écrire sous la forme d’un produit de facteurs pre¬ 
miers : n = kp, par exemple, k et p étant premiers. Dès 
lors le produit des classes C k C p est, d’après la défini¬ 
tion (19) ci-dessus, la classe C 0 = 0 , puisque le reste 
de la division de kp par n est nul. Donc, si n = kp : 

C k £ Ô, C p ^0 et C k C p = Ô. (23) 

— Si n est premier, on démontre que toute 
classe Cj possède un inverse C 7 1 tel que 
Cj C 7 1 = C i = 1. Cette propriété, jointe à la structure 
d’anneau, confère à l’ensemble fini Z/n la structure de 
corps : l’anneau des classes résiduelles modulo n dans 
Z est donc un corps fini lorsque n est premier. 

• Exemples. Considérons à nouveau l’ensemble 
Z/3 des classes résiduelles modulo 3. Cet ensemble 
contient trois classes C 0 , C A et C 2 , que nous^noterons 
en notation surlignée respectivement 0, 1,2. Etablis¬ 
sons les tables d’addition et de multiplication pour ces 
classes, on obtient : 


+ 

0 12 x 

Ô T 2 

Ô 

Ô T 2 Ô 

Ô Ô Ô 

T 

T 2 Ô f 

0 T 2 

2 

2 "Ô T 2 

0 2 T 


Tables d’addition et de multiplication des classes 
de l’ensemble Z/3. 


On constate que : 

1 - l’ensemble Z/3 est un ensemble fini de 
3 éléments ; 

2 - les opérations + et x sont associatives, 
commutatives et doublement distributives ; 

3-0 est l’élément neutre pour l’addition ; 1 est 
l’élément neutre pour la multiplication ; 

4 - chaque classe possède un symétrique pour 
l’addition : 

0+0 = 0; T + 2=Ô; 2+ï = Ô; 

5 - chaque classe différente de Ô admet un 
symétrique pour la multiplication : 

T" 1 =ï et J- 1 =2 . 

L’ensemble Z/3 est donc bien un corps commutatif 
fini. 

• Fractions. Soit à résoudre, dans le corps Z/n, 
l’équation : 

(3x = a , (24) 

a, /3 et x appartenant à Z/n. Si (3 ^ 0, il a certainement 
un inverse /3 _1 en vertu des axiomes de la structure de 
corps ; on est donc en droit d’écrire : 

/T 1 (3x = a . (25) 

Or /T 1 p = T (par définition de l’inverse) donc l’équa¬ 
tion précédente devient : 

T x = p-' a . (26) 

Comme 1 x=x (1 étant l’élément neutre pour la 
multiplication), et comme la multiplication est commu- 
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tative, on a finalement : 


x = a/3 1 . (27) 

Convenons d’écrire a/3 -1 = a//3 et envisageons 
l’addition x + x' dans le corps Z/n. Avec les conven¬ 
tions précédentes, d’après l’équation (27), cette addi¬ 
tion s’écrit : 


x 


+ x' = 


a a ' 
— + — 


/3 P' 


(28) 


On montrerait, à partir de la définition de l’addition 
des classes, que (28) est une égalité équivalente à : 


x +.x ' = 


a/3 ' a ' /3 

/3/r + /3/r’ 


(29) 


On retrouve ainsi la règle de réduction au même 
dénominateur de deux fractions ; l’étude systématique 
des règles de calculs sur les éléments de Z/n nous 
ferait retrouver les règles générales de calculs sur 
les fractions (voir p. 138). 


Propriétés des corps. 

• Sous-corps. Un sous-ensemble A d’un corps 
K est un sous-corps de K si A possède la structure de 
corps pour l’addition et la multiplication telles qu’elles 
sont définies dans K (en particulier, A contient les 
éléments neutres pour ces opérations, à savoir e = 0 et 
e' = 1). 

Nous avons rencontré, à diverses reprises, l’ensem¬ 
ble des nombres complexes, c’est-à-dire des nombres 
de la forme z = a 4- b\, a et b étant des nombres réels 
et i étant défini par i 2 = - 1. Les complexes forment un 
corps C pour l’addition et la multiplication et contien¬ 
nent l’ensemble IR des réels à titre de sous-ensemble : 
l’ensemble R ayant lui-même une structure de corps 
est un sous-corps de C. Même remarque pour l’ensem¬ 
ble O des rationnels : c’est un sous-corps de C. 

• Caractéristique d’un corps. Considérons 
l’ensemble Z/3 des classes résiduelles modu[o_ 3; c’est 
un corps fini dont les 3 éléments sont 0, 1 et 2. 
Formons les multiples positifs de la classe unité 1 
d’après les règles de l’addition des classes : 

f 1 x I = I ; _ 

I 2x1=1+l = 2; _ ( 30 ) 

] 3xj =j| +1 +1 =0 ;* 
l 4x1=14-1+1+1=3'X 1+1=1; 

* (règle / + j - n, paragraphe b ci-dessus) ; 

Les multiples positifs de la classe unité 1 sont donc : 

T, 2, Ô, T, 2, Ô, T, 2 , 0, ... 

L’ensemble Z/3 a donc les propriétés suivantes (qui 
sont équivalentes) : 1° les multiples positifs de l’unité 1 
ne sont pas distincts (ils se répètent de trois en trois) ; 
2° il existe deux entiers k et /, k > I, tels que /cl = /1, 
c’est-à-dire tels que {k - I) 1 =‘0j. ~3^_ la plus petite 
valeur de p = k — I telle que (k - I) 1 =0 est un nombre 
premier. Nous dirons que le corps Z/3 est modulaire et 
que sa caractéristique est p. 

Soit maintenant le corps Q des rationnels, dont les 
éléments neutres sont les entiers 0 et 1. Les multiples 
positifs de l’unité sont: 1, 2x1, 3x1, kx^, 
c’est-à-dire 1, 2, 3, ... k ... On constate que: 1° les 
multiples de l’unité sont tous distincts; 2° si k ^ /, 
alors /c x 1 / / x 1 ; 3° la seule valeur de p telle que 
p = k - I et que (k - /) x 1 =0 est p = 0. Le corps Q est 
non modulaire et de caractéristique nulle. D’une 
manière générale, tout corps qui contient le corps Q à 
titre de sous-corps est non modulaire. Dans le cas 
contraire, il est modulaire. En particulier, les corps finis 
sont tous modulaires. 

• Extension. Un corps K est une extension d’un 
corps A , si A est un sous-corps de K. Cette définition 
est complémentaire de celle de sous-corps, donnée au 
début du paragraphe. Considérons par exemple le 
corps <Q> des rationnels et l’ensemble K des nombres de 
la forme m + n \f2, m et a étant des rationnels appar¬ 
tenant à <0. Nous avons vu (p. 43) que K possédait 
une structure de corps : le corps K est une extension 
du corps Q des rationnels. 

Bien entendu, il existe une infinité d’extensions 
possibles d’un corps donné. Un cas intéressant est 
celui où le corps K est obtenu par adjonction au corps 
A de départ d’un élément (ou d’un ensemble) minimal. 
L’exemple classique, ici, est celui de l’extension des 
corps des réels : on peut construire une extension 
particulière C du corps R par adjonction à R d’une 
racine de l’équation : 

x 2 + 1 = 0 . (31) 

Le carré d’un réel x est toujours positif, 
l’équation (31) n’a pas de solution dans R. Convenons 


LES MATHÉMATIQUES MODERNES A L'ÉCOLE 


Les mathématiques traditionnelles repo¬ 
saient sur le calcul et le raisonnement 
géométrique. Dès l’école primaire, on 
enseignait donc aux enfants à compter, à 
résoudre par le calcul des problèmes sim¬ 
ples, à reconnaître des formes et des cons¬ 
tructions géométriques. Les mathémati¬ 
ques dites « modernes » (et qui ont, mainte¬ 
nant, un siècle d’existence : elles sont 
aussi « âgées » que les romans de Zola ou 
les toiles des Impressionnistes) reposent 
sur la combinatoire ensembliste : d’où une 
transformation de la pédagogie et l’intro¬ 
duction, dès l’école primaire, d’exercices 
concrets qui permettront, plus tard, le pas¬ 
sage à la théorie abstraite des ensembles. 
Nous donnons ici trois exemples de maté¬ 
riel mathématique moderne. 

1. Matricube. Sur un réseau en plastique 
transparent un enfant représente des situa¬ 
tions numériques. 

2. Blocs logiques. Ce matériel est consti¬ 
tué d’ensembles dont chaque élément est 
défini par sa forme, sa taille, son épaisseur 

et sa couleur. 

3. Sur la photographie on voit un dia¬ 
gramme de Venn à deux attributs : l’ensem¬ 
ble des carrés et l’ensemble des triangles. 
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MODULES 

d’appeler i un élément n’appartenant pas à IR et que 
nous définissons comme une racine de 
l’équation (31) ; alors nous pouvons écrire : 

i 2 + 1 = 0 , (32) 

d’où i 2 = - 1. 

Le corps C, composé d’éléments de la forme a + bi, 
a et b appartenant à IR, est une extension du corps IR 
des réels : la notion d’extension permet donc une 
définition élégante des nombres complexes et permet 
de justifier les règles opératoires dans C. Le corps non 
commutatif des quaternions est aussi une extension 
des réels, mais il est obtenu par adjonction des élé¬ 
ments (i, j, k), qui exige l’établissement des tables de 
multiplication et d’addition données plus haut (voir 
p. 44). 

La théorie des corps permet de démontrer de nom¬ 
breuses propriétés des ensembles possédant la struc¬ 
ture de corps. Nous les rencontrerons au fur et à 
mesure des besoins, dans la suite de cet exposé. 


La notion de module. 

Remarques historiques. 

A la fin du XIX e siècle, les structures de groupe, 
d’anneau et de corps étaient correctement définies. 
Ces notions permettaient une mise en ordre des 
connaissances en algèbre et en analyse, et leur exploi¬ 
tation s’est révélée très féconde, tant pour l’étude de la 
théorie des équations que pour celle de la théorie des 
fonctions. Dans la même période, les mathématiciens 
s’intéressent aux ensembles de vecteurs (le mot est 
introduit par Hamilton ; les vecteurs à n dimensions 
apparaissent chez Grassmann vers 1846) et à l’algèbre 
linéaire (voir p. 56). En 1888, Peano, commentant 
l’œuvre de Grassmann (la théorie que celui-ci appelait 
l 'algèbre extérieure), introduit la définition axioma- 
tique des ensembles de vecteurs qu’on appelle des 
espaces vectoriels et que nous étudions ci-après. 
Après 1920, les algébristes se sont aperçus que les 
espaces vectoriels étaient un cas particulier d’une 
structure plus générale : la structure de module. Les 
modules sont devenus un instrument important de 
l’algèbre à partir des travaux d’Emmy Noether (fille du 
mathématicien allemand Max Noether), d’Emil Artin et 
des algébristes de l’École américaine (Wedderburn, 
Dickson, Nathan Jacobson). 

Plus générale que la structure d’espace vectoriel, la 
structure de module joue un rôle de premier plan dans 
certaines branches très abstraites des mathématiques 
contemporaines (topologie, algèbre homologique). 

Définition. 

Les trois structures précédemment étudiées font 
intervenir uniquement des lois de composition interne 
(une seule pour la structure de groupe, deux pour les 
structures d’anneau et de corps) : nous les avons 
appelées, pour cette raison, des structures algébriques 
(quand il y a au moins deux lois de composition 
interne, une structure algébrique est une algèbre). 
Nous allons maintenant définir une structure qui fait 
intervenir une loi de composition interne et une loi de 
composition externe. 

Considérons un ensemble G dont les éléments 
seront notés x, y, ... Soulignons que x n’est pas 
nécessairement un nombre : ce peut être une transfor¬ 
mation géométrique, une fonction, une substitution ou 
n’importe quel autre être mathématique. Définissons 
sur cet ensemble une loi de composition interne 
additive lui conférant une structure de groupe, appe¬ 
lons zéro et notons 0 l’élément neutre de cette struc¬ 
ture. Le triplet (G, +, 0) est un groupe. 

Il s’agit maintenant de définir une loi de composition 
externe sur G. Pour cela, nous avons besoin d’un 
ensemble fl autre que G. Appelons a, (3, ... les 
éléments de fl et supposons que cet ensemble pos¬ 
sède une structure d’anneau. Cela dit, la loi de compo¬ 
sition externe se définira ainsi : à tout couple d’élé¬ 
ments (or, x) appartenant l’un à l’ensemble fl et l’autre 
à l’ensemble G, c’est-à-dire au produit cartésien 
fl x G, on fait correspondre un élément noté ax appar¬ 
tenant à G. La loi de composition externe est donc 
l’application de fl x G dans G décrite par : 

(ar,x)— >orX. (1) 

D’une manière générale, les éléments tels que or et x 
étant des êtres mathématiques quelconques, il y a lieu 
de distinguer orx et xa : le premier est dit composé à 
gauche (a est à gauche de x), et le second composé à 
droite (a est à droite de x). 

L’application (1) est dite un module à gauche sur 


l’anneau fl, si elle vérifie les conditions suivantes pour 
tout x, y Œ G et a, (3, 1 E fl (1 étant l’élément neutre 
pour la deuxième loi de composition interne dans fl) : 

( or(x + y) = ax + ay ; 

{a + (3) x = ax + (3x ; 

(a(3) x = a((3x) ; ™ 

1 x = x. 

On définirait de même un module à droite sur 
l’anneau fl par l’application : 

(x, or) —> Xor , 
vérifiant les conditions : 

(x + y) a = xor + yor ; 
x(or + (3) = xa + x(3 ; 
x(a/3) = (Xor) /3 ; 
xi — X . 


Exemple. 

• Nous donnerons ici un exemple simpliste de 
la notion de module, mais le lecteur ne doit pas oublier 
que cette structure concerne principalement des 
ensembles non numériques appartenant aux branches 
les plus abstraites des mathématiques contempo¬ 
raines. 

Considérons un ensemble constitué d’éléments x 
représentant des couples de nombres réels (a, b) ; par 
exemple : 

x = (-1,1); y = <3,V2); z = (1/3, 4) ; ... (5) 

Définissons sur cet ensemble une loi de composition 
interne appelée addition, commutative, associative, 
d’élément neutre 0 = (0, 0), que nous notons en carac¬ 
tères gras, pour ne pas le confondre avec le nombre 
zéro (mais cette précaution n’est pas indispensable 
quand on est familiarisé avec ce genre de calcul). 
L’addition est définie par : 

x+y= (a, b) + (c, d) = (a+c, b+d). (6) 

Par exemple, avec les valeurs de x et y données par 
(5) on aurait : 

X + y = (- 1 + 3,1 + V2) = (2, 1 + V2). (7) 

Il est clair que tout élément x = (a, b) possède un 
symétrique pour l’addition qui est - x = (- a, - b), 
puisque 

(a, b) + (- a, — b) = (0, 0) = 0 . 

Donc les éléments tels que x forment un groupe pour 
l’addition. Nous désignerons ce groupe par G : 

G = {x, y, z, ...} . (8) 

Soit par ailleurs l’anneau Z des entiers relatifs. Défi¬ 
nissons sur G une deuxième loi de composition, mais 
externe, comme on l’a fait dans la relation (1) ci-des¬ 
sus. Si A est un entier quelconque appartenant à Z et 
pour tout x = (a, b) E G, on aura donc : 

Ax = A(a, b) = (Aa, A b) . (9) 

L’équation (9) nous permet de calculer le compo¬ 
sé Ax, quels que soient les éléments A et x. Par 
exemple, pour x = (— 1,1), on aurait Ax = (— A, A) ; etc. 
Si l’on veut donner un nom à cette loi de composition 
externe, on peut l’appeler homothétie. Ce terme est 
emprunté à la géométrie élémentaire ; il signifie — 
grossièrement — « agrandissement » : l’élément 

(- A, A) est l’« agrandissement >> —en mathématiques, 
on dit d’une façon plus scientifique l’ homothétique — 
de l’élément (-1,1) dans le rapport A. 

On vérifierait ainsi que la loi (9) satisfait aux 
conditions (2) du paragraphe a : donc le groupe G 
d’éléments x = (a, b), muni d’une loi de composition 
externe dont les éléments A sont choisis dans 
l’anneau Z est un module sur Z. Il est inutile, ici, de 
préciser « à gauche » ou « à droite », car, en vertu de la 
commutativité de la multiplication arithmétique, l’élé¬ 
ment (Aa, Ab) est identique à l’élément (aA, bA). 

• Remarque. Si nous remplaçons l’anneau Z par 
le corps IR des réels, et que nous définissons de la 
même manière G et l’homothétie sur les éléments de 
G, le module est appelé espace vectoriel sur IR (le 
terme « espace » étant pris au sens d’« ensemble » et 
non en son sens usuel). En fait, l’exemple de module 
sur Z donné ci-dessus n’a pas d’intérêt et ne débouche 
sur aucun progrès des connaissances mathématiques : 
quand on calcule sur des anneaux numériques, on se 
place en général dans IR ou dans C, c’est-à-dire dans 
des corps. Dès lors, tous les modules définis sur ces 
corps sont des espaces vectoriels : nous les rencontre¬ 
rons ci-dessous. 

Retenons donc que la théorie des modules concerne 
principalement des ensembles abstraits : nous l’évo¬ 
querons notamment à propos de l’algèbre homologi¬ 
que et de la topologie. 


( 3 ) 

( 4 ) 



James Joseph Sylvester (1814-1897), mathémati¬ 
cien anglais dont les travaux ont porté sur l’algèbre 
linéaire, les formes quadratiques, la théorie des 
invariants, la théorie des nombres, la géométrie 
différentielle et la résolution des équations différen¬ 
tielles. 


Structure d'espace vectoriel. 

Remarques historiques. 

Un espace vectoriel est un module sur un corps. 
L’importance de cette structure est due au fait qu elle 
gouverne tous les chapitres de l’algèbre linéaire, qui, 
par ses nombreuses applications en mécanique, en 
physique, en informatique, etc., est une branche très 
exploitée des mathématiques. De plus, la théorie des 
espaces vectoriels s’applique aussi à l’analyse et à la 
géométrie différentielle. Bref, les mathématiciens se 
sont aperçus que, dès qu’ils cessaient de calculer sur 
des réels ou des complexes, c’est-à-dire dans des 
corps, ils se trouvaient confrontés aux calculs dans 
des espaces vectoriels. D’où l’importance capitale de 
cette structure. 

• Des nombres complexes aux vecteurs. A l’ori¬ 
gine de la notion très générale de vecteur (dont les 
vecteurs géométriques étudiés dans l’enseignement 
secondaire et utilisés en physique pour représenter des 
forces, des vitesses, des accélérations, etc., ne sont 
qu’un cas très particulier), il y a les travaux de Gauss 
sur les nombres complexes, ceux de Hamilton sur les 
quaternions (voir p. 43) et ceux de Grassmann sur 
Y algèbre extérieure. Les recherches de Gauss datent 
du début du XIX e siècle, celles de Hamilton de 1843- 
1853 ( Lectures on quaternions, 1853), et celles de 
Grassmann, ( Lineale Ausdehnungslehre, Algèbre li¬ 
néaire extérieure) de 1844. 

Nous avons déjà dit qu’un nombre complexe était un 
nombre de la forme a + bi, a et b appartenant à 
l’ensemble des réels et i étant défini par i 2 = -1. 
Gauss, puis Hamilton, ont proposé de définir un nom¬ 
bre complexe comme un couple (a, b) de réels. L’addi¬ 
tion de deux nombres complexes est alors définie par : 

(a, b) + (a', b') = (a + a’, b + b’) (1) 

et la multiplication par : 

(a, b) x (a', b') = (aa' - bb\ ab' + ba'). (2) 

Par exemple les deux complexes z = 1 + 5 i et 
z'= 2 — 3 i sont représentés par z = (1,5) et 
z'= (2,-3); leur somme est z + z' = (3, 2) et leur 
produit est zz' = (17, 7), d’après les règles (1) et (2). En 
explicitant, on aurait z + z' = 3 + 2 i et zz' = 17 + 7 i. 

On pourrait aussi calculer d’une manière analogue 
sur des quaternions, en écrivant q = (a, b, c, d) : on 
retrouverait les résultats des pages 43-44. Par exem¬ 
ple, 

q + q' = (a + a', b + b', c + c', d + d'). 
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C.A.F. Varsovie. 


Bien entendu, pour parvenir à des résultats de ce 
genre, il faut définir axiomatiquement avec soin les 
opérations envisagées. Enfin Grassmann a étudié 
comment on pouvait calculer sur des éléments à 
n termes de la forme x = (a, b, c ,..., n). 

Comme nous le verrons ci-après, un objet mathéma¬ 
tique tel que (a, b ,..., n) est appelé un vecteur ; les 
éléments a, b, c, .... n sont ses composantes ; le 
nombre n de composantes est la dimension du vec¬ 
teur. Avec ces définitions, un nombre complexe est un 
vecteur à deux dimensions, un quaternion un vecteur à 
quatre dimensions, les vecteurs de Grassmann sont à 
n dimensions. En géométrie, un segment fléché ÜÂ 
(nous adopterons la notation OA) peut être défini par 
ses projections a et b sur deux axes Ox et Oy, et 
comptées positivement ou négativement selon leur 
orientation par rapport à ces axes : nous écrirons 

donc : OA = (a, b) . (3) 


Le couple (a, b) qui définit un nombre complexe sert 
aussi à définir un segment fléché, qu’on appelle vec¬ 
teur géométrique : la représentation géométrique des 
complexes découle de cette importante remarque (voir 
p. 56). 

L’analyse vectorielle et le calcul matriciel se sont 
développés entre 1850 et 1880, sous l’impulsion de 
Sylvester et de Cayley, créateurs de la théorie des 
matrices (voir pp. 59-60), puis du Français Hermite et 
des travaux algébriques, en rapport avec l’analyse, de 
Kronecker, H.J. Smith, Weierstrass. La définition axio- 
matique des espaces vectoriels abstraits apparaît 
enfin en 1888 chez Peano. 

• De l’algèbre à l’analyse. La notion d’espace 
vectoriel se retrouve en analyse, lorsque l’Ecole ita¬ 
lienne (Volterra, Ascoli, Arzelà, Dini) étudie l’espace 
des fonctions continues , entre 1870 et 1880, à la suite 
des travaux de Weierstrass (auteur d’un théorème sur 
l’approximation des fonctions continues par des poly¬ 
nômes en 1870 ; ce théorème ne sera généralisé que 
plus de 60 ans plus tard, par M. Stone, en 1936). Les 
progrès de l’analyse imposent alors de doter la struc¬ 
ture d’espace vectoriel de propriétés complémentaires, 
ce qui conduit à la définition de nouvelles structures. 

— Dans un espace vectoriel, on ne peut faire 
que des combinaisons linéaires (du premier degré) : 
addition de deux vecteurs ou multiplication d’un vec¬ 
teur par un élément A extérieur à l’ensemble et apparte¬ 
nant à un corps K (voir par exemple p. 46 : la loi de 
composition externe est appelée homothétie). 

— Si on définit, en outre, la notion de distance 
dans un ensemble ayant une structure d’espace vecto¬ 
riel, ce qui impose — on le verra — d’axiomatiser la 


notion de passage à la limite, l’espace considéré est dit 
métrique. Un espace qui est à la fois vectoriel et 
métrique est un espace vectoriel normé ou espace de 
Banach : cette notion, apparue en 1920-1922, a été 
l’objet des travaux de S. Banach, H. Hahn et E. Elly. 

— Si l’on ajoute à un espace vectoriel normé 
une deuxième loi de composition externe définissant la 
correspondance entre deux vecteurs d’une part et un 
élément A d’autre part (produit scalaire au sens géné¬ 
ral), on obtient un espace hilbertien. La théorie de ces 
espaces est antérieure à celle des espaces de Banach ; 
elle a été élaborée par Volterra (1887), Fredholm (1900), 
Hilbert (1906) et E. Schmidt (1907). Une théorie axio- 
matique de ces espaces a été construite vers 1930 par 
Stone et von Neumann. 

— Si l’espace vectoriel normé considéré pos¬ 
sède en outre une deuxième loi de composition interne 
(multiplication), la structure s’appelle une algèbre (au 
sens non technique d’ensemble muni d’au moins deux 
lois de composition interne) qu’on appelle une algèbre 
normée. La théorie des algèbres normées a été intro¬ 
duite par l’Allemand I. Gelfand en 1938. 

Les rapports entre ces différentes structures sont 
rappelés sur le schéma ci-après. 



+ notion de distance ( D) 

▼ 



Principales structures d’espace vectoriel utilisées 
en analyse (on n’a pas mentionné ici les espaces 
topologiques, les espaces partiellement ordonnés et 
d’autres variétés d’espaces qui seront définies ulté¬ 
rieurement) ; Ici = loi de composition interne ; 

Ice = loi de composition externe. 


Stefan Banach (1892-1945), mathématicien polo¬ 
nais, qui a élaboré la théorie des espaces vectoriels 
normés vers 1920-1922, et participé à la création de 
l’analyse fonctionnelle linéaire. 



Définition. 

• Définition générale. Un espace vectoriel est 
un module sur un corps. La notion de module est 
définie p. 46, et, en principe, cette définition générale 
d’un espace vectoriel est suffisante. Nous allons 
cependant l’expliciter axiomatiquement. 

Soit un ensemble E dont les éléments x, y,... seront 
nommés vecteurs et soit un corps K dont les éléments 
sont désignés par les lettres grecques a, p ,... Pour que 
E soit un module sur K, il faut et il suffit que : 

1 - E ait une structure de groupe (E, +, 0) pour 
une loi de composition interne additive + ; 

2 - qu’on définisse sur E une loi de composition 
externe, faisant intervenir le corps K : (a, x)^ax, 
comme à la page 46. 

Alors, K étant un corps, le module E est un espace 
vectoriel sur le corps K. Les conditions 1 et 2 peuvent 
s’écrire à l’aide des axiomes suivants, pour tout x, y, 
z G E et pour tout a, p G K : 

1 -x+y=y+x; 

2 - (x + y) + z = x + (y + z) = x + y + z; 

3 - il existe dans E un élément 0 (vecteur nul) 

tel que pour tout xG E, x + 0 = 0 + x = 0 ; 

4 - pour tout x G E, il existe un symétrique - x 

tel que x - x = 0, 0 étant le vecteur nul ; 

5 - a(x + y) = ax + ay ; 

6 - (a + P) x = ax + /3x ; 

7 - il existe dans K un élément unité 1 tel que 

pour tout xGE, 1 x = xi = x; 

8 - a(px) = ( aP) x. 

Les axiomes 1 à 4 définissent la structure de corps et 
l’élément neutre pour l’opération + ; les axiomes 5 à 8 
définissent la loi de composition externe («,x)—>cxx. 

• Remarques : 

1 - Les axiomes 1 à 4 sont les mêmes que les 
axiomes définissant l’addition des réels, mais il ne faut 



STRUCTURE D'ESPACE VECTORIEL 

pas oublier que x et y ne sont pas des nombres réels 
(ni même, en général, des nombres complexes). 
Comme les axiomes en question concernent unique¬ 
ment l’opération +, sans que la nature des objets 
additionnés entre en jeu, les conséquences des axio¬ 
mes de l’addition des réels sont donc valables ici aussi, 
à savoir : unicité de l’élément neutre 0, unicité de 
l’opposé - x, existence et unicité de la solution de 
l’équation a + x = b (d’où une définition possible de la 
soustraction dans E). 

2 - L’application (a, x)—»ax est une loi de 
composition externe : il ne faut pas y voir une 
« multiplication dans E ». En particulier : 

— Il existe dans le corps K deux lois de compo¬ 
sition interne, 1 et 1' admettant respectivement e et e' 
comme éléments neutres (voir la définition d’un corps 
p. 43) ; dans l’axiome 7, nous avons écrit e' = 1 
(élément unité), car il ne peut y avoir aucune ambi¬ 
guïté. En effet le groupe E ne possède pas de 
deuxième loi de composition interne, donc il n’a pas 
d’élément unité. 

— On peut appeler 0 l’élément neutre e dans K, 
mais il ne faut pas le confondre avec l’élément neutre 0 
dans E. Pour les distinguer, on peut écrire ce dernier 
avec une flèche : 0 ou en caractères gras : 0. 

— On.montre alors que, pour tout a G K et pour 
tout x G E : 

ex = 0 x = 0 ; (5) 

et si ax =0, alors ou bien a = 0, ou bien x = 0. Enfin, 
pour tout x, on a : 

- x = (- 1) x. (6) 

3 - Lorsque le corps K est numérique, l’espace 
vectoriel E est dit lui-même rationnel si K est le 
corps <Q des rationnels, réel si K = R ou complexe si 
K = C. Mais les éléments de E ne sont pas pour cela 
des nombres (ce sont des listes de nombres comme 
nous le verrons dans les exemples ci-après). 


Exemples. 

• Un exemple trivial. Imaginons un ensemble de 
caisses enregistreuses dans un grand magasin ou dans 
un super-marché et désignons ces caisses par A, B, C, 
D, ..., N. Chaque jour ouvrable de la semaine, un 
technicien chargé d’étudier le fonctionnement de 
l’entreprise relève le total journalier de chaque caisse. 
Chaque semaine, l’activité d’une caisse est représentée 
par un relevé qui a la forme d’un tableau tel que : 


Jours 

L 

M 

Me 

J 

V 

S 

Sommes 


x 2 

*3 

x 4 

*5 

*6 


L, M, ... sont les six jours de la semaine (lundi, mardi, 
etc.) ; x v x 2 , ..., x 6 sont les totaux enregistrés respecti¬ 
vement le lundi, le mardi, ..., le samedi, exprimés en 
une unité monétaire déterminée, la même pour toutes 
les caisses. Le relevé de la caisse A sera noté A, le 
relevé de la caisse B sera noté B, etc. On écrira en 
abrégé : 

A = (x„ x 2 , x 3 , x 4 , x 5 , x 6 ) ; (7) 

b = (y„ y 2 , y 3 . y„ y 6 . y 8 ) : (8) 

etc. 

On aura, par exemple, l’unité étant le franc : 

A = (125, 142, 251,247, 290, 305) ; (9) 

B= (75,78,81,87,90,111); (10) 

etc., 

ce qui signifie que la caisse A a enregistré 125 F le 
lundi, 142 F le mardi, etc. ; et la caisse B, 75 F le lundi, 
78 F le mardi, etc. 

— Si nous voulons représenter l’activité globale 
des deux caisses A et B, nous devons faire la 
somme A + B des deux relevés. Ainsi les caisses A et 
B ont enregistré ensemble 125 + 75 = 200 F le lundi, 
142 + 78 = 220 F le mardi, etc. On écrira cette opéra¬ 
tion comptable sous la forme d’une addition (+) des 
relevés A et B, addition définie par la règle opératoire 
suivante : 

A + B = (x, + y„ x 2 + y 2 , x 3 + y 3 , x 4 + y 4 , 

x 5 + y s . -<6 + y 8 ) • (il) 

Il est facile de montrer, en vertu des propriétés 
additives des nombres rationnels x et y, que : 

A + B = B + A; 

(A + B) + C = A + (B + C) ] (12) 

A +(0, 0, 0, 0, 0, 0) = (0, 0, 0, 0, 0, 0) + A = A. 
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La première égalité signifie que la somme de deux 
relevés est la même, quel que soit l’ordre dans lequel 
on les prend pour les additionner ; la seconde que l’on 
peut associer indifféremment les relevés A et B et 
ajouter le résultat de leur addition au relevé C, ou bien 
ajouter le relevé A à la somme des relevés B et C, et 
qu’on obtient dans ce cas le même résultat. Autrement 
dit, l’addition des relevés est commutative et associa¬ 
tive. Quant à la troisième égalité, elle nous dit que le 
relevé (0, 0, 0, 0, 0, 0) est l’élément neutre pour l’addi¬ 
tion ; nous écrirons donc : 

(0,0, 0,0, 0,0) =0 . (13) 

D’autre part, si nous convenons de noter à l’aide d’un 
nombre positif les opérations créditrices et à l’aide 
d’un nombre négatif les opérations débitrices d’une 
caisse, nous pouvons définir le relevé - A, opposé à 
A, c’est-à-dire tel que : 

-A + A = A A =0 (14) 

Avec les notations précédentes on aurait : 

~ 4 = (- x,, - x 2 , - x 3 , - x 4 , - x 5 , - x 6 ). (15) 

Les égalités (12) et la définition (15) nous montrent 
que l’ensemble des relevés tel que A est un groupe 
pour l’addition, l’opération « addition » signifiant ici 
cumul des relevés des deux caisses et se faisant selon 
la règle (11). 

— Définissons maintenant l’opération « chan¬ 
gement d’unité monétaire » : pour exprimer le relevé A 
de l’égalité (9) en dollars, sur la base 1 dollar = 
5 francs, il faut diviser par 5 chaque total journalier, 
c’est-à-dire le multiplier par la fraction A = 1/5. On 
obtient ainsi le relevé AA : 

A4 = (25, 28,4, 50,2, 49,4, 58, 61). (16) 

Plus généralement, A appartenant au corps <Q> des 
rationnels, on définit l’opération A A par : 

A A = (Ax^ Ax 2 , Ax 3 , Ax 4 , Ax 5 , Ax 6 ) . (17) 

L’opération « changement d’unité monétaire » est 
donc une loi de composition externe pour l’ensemble 
des relevés ; elle vérifie les axiomes 5 à 8 de la 
structure d’espace vectoriel. 

— En résumé, les relevés A constituent un 
ensemble E muni d’une loi de composition interne 
(addition) lui conférant la structure de groupe et d’une 
loi de composition externe (que nous pouvons appeler 
homothétie) : c’est donc un espace vectoriel sur le 
corps Q des rationnels. 

• Un exemple géométrique. Soit l’ensemble des 
vecteurs géométriques du plan xOy, défini par deux 
axes de coordonnées rectangulaires Ox et Oy. A cha¬ 
que vecteur AB on associe ses composantes (X, Y) 
qui sont des nombres réels (voir figure). On peut munir 
l’ensemble des vecteurs AB du plan de deux lois de 
composition, l’une interne, l’autre externe, en faisant 
intervenir le corps des réels, qui vérifient les axiomes 1 
à 8 ci-dessus ; donc les segments fléchés AB forment 
un espace vectoriel sur le corps IR des réels. 


y 



Vecteur géométrique AB à deux composantes. 
Les composantes A' B' = X et A" B" = Y ont été tra¬ 
cées en rouge. En raison de l’orientation du vecteur 
dans le cas de figure considéré, X et Y sont ici des 
nombres réels négatifs (les segments A' B' et A " B " 
sont orientés négativement sur les axes Ox et Oy). 


Précisons la nature des deux lois de composition sur 
l’ensemble des vecteurs géométriques. 

— L’addition vectorielle AB + CD consiste à 
construire le vecteur AD diagonale d’un parallélo¬ 


gramme dont les côtés sont les vecteurs AB et AC', le 
vecteur AC, étant parallèle au vecteur CD, de même 
sens et de même grandeur géométrique que ce 
vecteur ; 

— L’homothétie À AB (A e (R) consiste à cons¬ 
truire le vecteur AL de même direction que le vecteur 
AB, orienté comme celui-ci lorsque A est positif, et en 
sens contraire si A est négatif, et de grandeur géomé¬ 
trique égale à celle de AB multipliée par le nombre A. 

La première loi est une loi de composition interne 
dont l’élément neutre est le vecteur 0, réduit à n’être 
qu’un point (A et B sont confondus), la deuxième loi 
est une loi de composition externe sur le corps des 
réels. Ces lois respectent les huit axiomes (4) ; donc 
les vecteurs géométriques du plan forment un espace 
vectoriel pour les deux lois de l’addition vectorielle et 
l’homothétie. 



I. — Règle du parallélogramme 
(vecteurs de même origine). 



(vecteurs quelconques). 



Les deux lois de composition des vecteurs du plan. 

I - Addition vectorielle : cette loi de composition 
interne fait correspondre à tout couple de vecteurs un 
troisième vecteur appelé leur somme vectorielle et 
construit selon la règle du parallélogramme. Si les 
vecteurs ont même origine, comme c’est le cas ici (AB 
et AC), la construct io n e s t immédiate et l’on a 

AB + ÂC=ÂD. 

II - Si les vectfurs n’ont pas une origine commune 
(tels AB et CD) il faut appliquer la construction 
indiquée dans /e texte. } La somme vectorielle des 

vecteurs AB * et CD est ici le vecteur AD'. 

III - L’homothétie \(\ G IR J t ra nsf o rme le vecteurÂB 
en son homothétique XAB = AL (ici, on a pris 

(X = - 2 )). 


On peut écrire un vecteur géométrique ^quelconque 
du plan sous la forme V = (X, Y), X et Y désignant 

ses deux composantes selon les axes Ox et Oy. Alors 
les deux lois de composition précédentes se définis¬ 
sent pour tout (X, Y) GE et pour tout A G [R par : 

f(X, Y) + (X', Y') = (X+X',Y+ Y') ; (1Q) 

{ A(X, Y) = (AX, AV). 

Il est facile de vérifier que ces deux lois vérifient les 
axiomes de la structure d’espaces vectoriels, avec (0, 0) 
comme vecteur nul et en notant (- X, — Y) le vecteur 
symétrique pour l’addition de (X, Y). 

— En résumé, l’ensemble des vecteurs (X, Y) du 
plan est un espace vectoriel sur le corps IR des réels. 
On notera l’analogie entre l’objet (X, V), que nous 
appelons un vecteur (au sens général) et dont l’image 
est un vecteur géométrique, et l’objet A = relevé 
hebdomadaire = (x 1s x 2 , x 3 , x 4 , x 5 , x 6 ) de l’exemple 
précédent, qui est aussi un vecteur sur le corps IR des 
réels. La différence entre les deux objets est le nombre 
des composantes : deux pour les vecteurs (X, Y) du 
plan et six pour les vecteurs-relevés. On précise ce fait 


en appelant (R 2 l’espace vectoriel des vecteurs géomé¬ 
triques et IR 6 celui des relevés. 

• Plus généralement, un ensemble dont les 
éléments x sont de la forme : 

x = (x„x 2 .x„), (19) 

x v x 2 , .... x n étant des nombres réels, est appelé un 
espace vectoriel sur le corps R des réels si on le munit 
de la loi de composition interne (x + y) et de la loi de 
composition externe (A, x) —* Ax, A G R, définie 
comme précédemment : 

x + y=(x„x 2 . x n ) + (y„y 2 .y„) 2 

= (x,+ y,,x 2 + y 2 . x n + y„), 

et : 

Ax = (Ax 1? Ax 2 ,.... Ax n ). (21) 

Nous préciserons les définitions suivantes : 

— x est un vecteur à n dimensions (ou à n 
composantes) ; 

— x 1t x 2 , ..., x n sont les n composantes du 
vecteur x ; 

— l’espace vectoriel est dit n-dimensionnel ; on 
le note IR n pour indiquer que les n composantes sont 
des nombres appartenant à IR ; 

— les nombres tels que A appartiennent eux 
aussi à R : on précise donc que (R n est un espace 
vectoriel n-dimensionnel sur le corps (R des réels ; le 
corps qui sert à constituer un espace est appelé 
domaine d’opérateurs (voir la définition générale d’une 
loi de composition externe au paragraphe B, a 
ci-dessus) ; 

— le vecteur (0, 0, ..., 0) est le vecteur nul noté 0 
(ou (fou 0 s’il risque d’y avoir ambiguïté avec le U aes 
réels). 

— Le produit scalaire de deux vecteurs 
x= (x 1f x 2 ,..., x n ) et y= ( y v y 2 ,..., yj est le nombre réel 
p défini par la combinaison linéaire : 

P = Xi y 1 + x 2 y 2 + ••• + x n y n . (21 bis) 

On le désigne souvent par un point placé entre les deux 
vecteurs: p=x.y. Deux vecteurs dont le produit 
scalaire est nul sont dits orthogonaux. 

Les vecteurs géométriques à deux dimensions sont, 
on l’a vu, les images de IR 2 ; les vecteurs géométriques 
à trois dimensions sont les images de IR 3 . Pour n > 3, 
on ne peut plus construire d’images géométriques... 
mais est-ce indispensable ? 

• Autres exemples. 

— Nous étudierons, en analyse, la notion de 
fonction numérique f(x), x étant une variable réelle 
appartenant à un ensemble déterminé (qui est le 
domaine de définition de la fonction). La valeur de la 
fonction f(x) est un nombre réel, qu’on peut calculer 
par les méthodes du calcul ordinaire. Par exemple si 
f(x) = x 2 - 1, cette fonction est calculable dans le 
corps des réels quel que soit xGlR. Le domaine de 
définition de la fonction f{x) est donc : 

E = {les nombres réels } . 

L’ensemble des valeurs de f(x), lorsque x décrit 
toutes les valeurs de l’ensemble E, forme un espace 
vectoriel sur R qu’on écrit R(E). 

— Si, dans l’équation (21), on choisit A dans le 

corps C des complexes et si les composantes x v x 2 . 

x n sont elles-mêmes complexes, on obtient l’espace 
vectoriel C n sur le corps des complexes. 

— Tous les exemples que nous avons donnés 
sont des exemples numériques : les composantes des 
vecteurs considérés et le corps sur lequel on a cons¬ 
truit les espaces vectoriels sont des ensembles numéri¬ 
ques (rationnels, réels ou complexes selon les cas). 
Mais il s’en faut de beaucoup que tous les espaces 
vectoriels soient numériques. On peut construire des 
ensembles ayant des structures d’espaces vectoriels et 
dont les éléments ne soient pas des nombres : par 
exemple un ensemble de transformations géométri¬ 
ques, ou bien un ensemble de morphismes (voir défini¬ 
tion p. 38), ou de tout autre être abstrait. Ces espaces 
abstraits peuvent être traités de la même manière que 
les espaces numériques. 

Combinaisons linéaires. 

Soit x-,, x 2 , ..., x n , n vecteurs appartenant à un 
espace vectoriel E (attention : dans les exemples 
numériques du paragraphe c, x v x 2 , ..., x n désignaient 
les composantes numériques d’un vecteur sur le corps 
des réels ; ici le corps K sur lequel est construit E est 
quelconque, et x 1f x 2 , ..., x n désignent non pas les 
composantes d’un vecteur mais des vecteurs distincts, 
numériques ou abstraits). Appelons a 1f a 2 , ..., a n n 
éléments appartenant à K. La loi de composition 
externe {a, x)—^axnous permet de former des vec¬ 
teurs a 1 x 1t a 2 x 2 , etc. Considérons le vecteur x obtenu 
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Quoi de plus semblable qu’une main droite et qu’une main gauche ? Et pourtant il s’agit de deux volumes 
géométriques impossibles à superposer dans l’espace à trois dimensions. Ci-dessus, une lithographie de 
M. C. Escher, Main dessinant (1948), qui traduit admirablement le trouble de l’artiste confronté au problème de 

l’espace à plus de trois dimensions. 


en faisant l’addition, selon les règles de l’espace 
vectoriel considéré, de tous ces vecteurs : 

x = a 1 X 1 4- a 2 x 2 H- V a n x n . (22) 

Le vecteur x est une combinaison linéaire (c’est-à- 
dire du premier degré) des vecteurs x^ x 2 , x n . On 
peut aussi le désigner en se servant du symbole I 
(sigma) dont on se sert pour indiquer la somme de / 

i = n 

variables. On écrira alors : x = £ <*,x, (les indications 

/=i 

/ = 1 et / = n au-dessous et au-dessus du symbole 
sigma signifient que la somme est étendue de l’élément 
ct : x 1 à l’élément a n x n ). 

• Remarques : 

1 - Notons d’abord qu’il ne peut pas être formé 
de combinaisons qui ne soient pas du premier 
degré. En effet, une combinaison du second degré, par 
exemple, serait a 1 x 2 ou a 1 x 1 x 2 : mais pour cela, il 
faudrait avoir défini une deuxième loi de composition 
interne sur E, permettant de calculer x 1 x 2 ou x], ce 
qui n’est pas le cas, puisque la structure d’espace 
vectoriel ne contient qu’une loi décomposition interne 
additive. 

2 - S’il existe dans K des valeurs a v a 2 ,.... 
non toutes nulles telles que x = 0, les vecteurs 
x„ x 2 ,..., x n sont dits linéairement dépendants ; cela 
signifie que chacun d’eux, à coefficients non nuis, peut 
être décrit sous la forme d’une combinaison linéaire 
des autres. 

3 - Si l’égalité x = 0 implique a 1 = a 2 = 
...^ = 0, alors les vecteurs x A , x 2 ,..., x n sont dits 
linéairement indépendants, et on ne peut exprimer l’un 
d’entre eux en fonction d’une combinaison linéaire des 
autres. 

4 - Exemple : soit dans l’espace vectoriel IR 2 sur 
le corps des réels les deux vecteurs x 1 =(1,0) et 
x 2 = (0,1). Existe-t-il deux réels a 1 et a 2 , non tous deux 
nuis, tels que x 1 + a 2 x 2 = 0 ? On a, d’après la 
définition de la loi de composition externe ax: 

oty Xy + a 2 X 2 = (a 1( 0) + (0, ol 2 ) = (a 1t a 2 ) (23) 

et cette somme est nulle si et seulement si ay = a 2 = 0. 
Donc les vecteurs x^ et x 2 sont linéairement indépen¬ 
dants. En revanche, si nous considérons dans U 2 un 
troisième vecteur x 3 = (a, b), alors il est possible de 


trouver trois nombres ay, a 2 et a 3 non tous nuis tels 
que a 1 x 1 -H a 2 x 2 + a 3 x 3 = 0 = (0, 0). En effet on doit 
avoir : 


K, 0) + (0, a 2 ) + (a 3 a, a 3 b) = (0, 0) , (24) 

d’où : 


(ay + a 3 a = 0 ; 
| a 2 + « 3 b = 0 . 


(25) 


On peut trouver trois valeurs de a 2 et a 3 non 
toutes nulles qui vérifient (25). Donnons par exemple à 
a 3 la valeur arbitraire « 3 = 1 ; en faisant ay = - a et 
a 2 = - b, le système (25) est vérifié. Donc il en est de 
même pour l’équation (24) : les vecteurs x 1t x 2 et x 3 
sont donc linéairement dépendants. 

5 - D’une manière générale, tout vecteur x 3 de 
IR 2 peut s’exprimer linéairement en fonction de x 1 et de 
x 2 , ou de tout autre couple avec lequel il serait 
linéairement dépendant. Les lecteurs qui ont quelques 
rudiments de géométrie analytique savent que tous les 
vecteurs V(X, Y) du plan s’expriment linéairement en 
fonction des vecteurs unitaires / et/des axes, sous la 
forme V = Xi + Yj (voir aussi p. 95). 


• Dimensions d’un espace vectoriel. Un espace 
vectoriel est dit n-dimensionnel s’il existe dans cet 
espace n vecteurs linéairement indépendants et si 
n’importe quel ensemble de n +1 vecteurs est un 
ensemble de vecteurs linéairement dépendants. Si 
pour tout n il y a n vecteurs indépendants, l’espace est 
dit de dimension infinie. 

Tout ensemble de n vecteurs indépendants dans un 
espace n-dimensionnel est appelé une base pour cet 
espace (exemple : les deux vecteurs unitaires/et/pour 
l’espace IR 2 des vecteurs géométriques à deux dimen¬ 
sions ; les trois vecteurs unitaires /, j ,k pour l’espace 
IR 3 des vecteurs géométriques à trois dimensions). 


• Décomposition d’un vecteur suivant une base. 
Soit fy, f 2 , ..., f n les n vecteurs linéairement indépen¬ 
dants constituant une base dans un espace vectoriel E 
sur un corps K, et soit x un vecteur quelconque de 
l’espace E. Alors les n + 1 vecteurs { x, fy, f 2 , -, f n ) ne 
sont pas linéairement indépendants d’après ce qui 
vient d’être dit et il existe des nombres a, a v a 2 , ..., a n 
non tous nuis tels que : 

aX + ayfy + a 2 f 2 +•■• + a n f n = 0 . ( 26 ) 
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De plus, a 7^0, sinon le premier terme de 
l’équation (26) serait nul, et fy, f 2 ,..., f n ne seraient plus 
linéairement indépendants, puisque la somme 
ayfy T- a 2 f 2 + ••• + a n f n serait nulle avec des coeffi¬ 
cients a,, a 2 ,..., a n non tous nuis. On peut donc, 
puisque a ^ 0, diviser tous les termes de 
l’équation (26) par a, ce qui permet de décomposer 
de la manière suivante : 

x= -(Süf,+£Lf 2 + ... + ^f n \ (27) 

\ a a a / 

Soit, en posant /3, = - a,/a : 

X = Æl + 02^2 H - ^ Pnfn- ( 28 ) 

Le vecteur x a été décomposé suivant la base f 
f 2 ,..., f n , et cette décomposition est unique. 

• Application. Considérons les vecteurs de 
composantes (x, y, z) constituant l’espace vectoriel IR 3 
sur le corps des réels. Les trois vecteurs : 

# = (1,0,0); /= (0,1,0); k = (0,0,1) (29) 

sont linéairement indépendants. En effet, l’égalité: 

«i / + ol 2 j + «3 k — (0, 0, 0) (30) 

implique a 1 = a 2 = a 3 = 0. Donc : {#,/, k } est une base 
pour IR 3 . Un vecteur V(x, y, z) quelconque peut s’écrire 
sous la forme : 

V = (x, y, z) = x /+ yj + zk (31 ) 

Les nombres x, y et z sont les coordonnées (= les 
composantes) du vecteur V. 

En géométrie, le vecteur V= OM représente un point 
M dans un système d’axes Ox, Oy, Oz ; (x, y, z) sont 
les coordonnées du point M. Le vecteur OM est la 
diagonale du parallélépipède construit sur xi, yj et zk 



Base d’un espace vectoriel à trois dimensions. 
Les points^M de l’espace géométrique définissent les 
vecteurs V = OM, dont l’ensemble est un espace 
vectoriel à trois dimensions surje^ corps des réels 
désigné par U 3 . Les vecteurs { i,j, k}, appelés aussi 
vecteurs unitaires des axes, forment une base pour 
R 3 . Un vecteur quelconque V = (x, y, z) est la somme 
vectorielle xt+ yf+ zï<, c’est-à-dire la diagonale du 
parallélépipède construit sur les vecteurs xi, yj et zk. 


Sous-espaces vectoriels. 

• Définition. Un sous-ensemble A d’un espace 
vectoriel E sur un corps K est appelé un sous-espace 
vectoriel de E s’il possède lui-même la structure 
d’espace vectoriel sur K pour les deux lois de composi¬ 
tion définies sur E (c’est-à-dire: si x, yeA, alors 
x + y El A et aXEA pour tout a E K). Le vecteur nul 
ÛEE est appelé sous-espace nul ; l’espace E 
lui-même est un sous-espace identique à E. Ces deux 
sous-espaces sont dits impropres ; tous les autres 
sous-espaces sont appelés propres. Ainsi IR 2 (les vec¬ 
teurs géométriques à deux dimensions) est un 
sous-espace propre de (R 3 (vecteurs géométriques à 
trois dimensions) sur le corps IR. 

• Somme directe. Soit Ay, A 2 , ..., A n les 
sous-espaces d’un espace vectoriel E. Si un vecteur 
quelconque x E £ peut être décomposé sous la 
forme : 

x = x 1 + x 2 + -*-+x„, (32) 

de sorte que x 1 E Ay, x 2 E A 2 , ..., x n E A n et si cette 
décomposition est unique, alors l’espace vectoriel E 
est dit somme directe de ses sous-espaces. 

• Espace quotient. On peut définir dans E la 
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relation d’équivalence suivante : deux vecteurs x, 
Y ^ E sont équivalents au modulo A (= selon le 
sous-espace A) si x -yEA. On peut écrire cette 
relation sous la forme : 

x= y (mod A), (33) 

ou sous la forme x ~ y (le symbole « ~ » se lit 
«équivalent à»). L’ensemble des vecteurs y équiva¬ 
lents à un vecteur x est la classe d’équivalence 
x (modulo A), qui contient aussi l’élément x lui-même. 
L’ensemble des classes d’équivalence x, ÿ, z, ... est 
l’ensemble-quotient E/A de l’espace vectoriel E par le 
sous-espace A. E/A est appelé un espace quotient. 

Un exemple géométrique de relation d’équivalence 
dans un espace vectoriel E est la relation « équipollent 
à >> pour les vecteurs de l’espace IR 3 . En géométrie, 
deux vecteurs V et V'sont dits équipollents lorsqu’ils 
sont : 1° parallèles (c’est-à-dire qu’ils sont portés par 
une même droite ou par des droites parallèles) ; 2° de 
même sens ; 3° de même module (= de même gran¬ 
deur géométrique). Si deux vecteurs sont équipollents, 
il est clair que leur différence V V (obtenue en 
additionnant le vecteur V et l’opposé du vecteur V) est 
le vecteur nul 0 , qui constitue le sous-espace nul 
A ={ 0], défini plus haut. Nous pouvons donc écrire 
l’équation (33) sous la forme V = V' (mod 0). Tous les 
vecteurs équipollents à un vecteur a e IR 3 constituent 
la classe d’équivalence a, et le vecteura lui-même e_n 
fait partie ; on a de même les classes d’équivalence b , 
c ... L’ensemble { a, b , c, ...} est l’espace quotient 
[R 3 /0- Nous avons utilisé la relation d’équipollence 
dans la figure décrivant la loi de composition interne 
sur les vecteurs du plan (voir ci-dessus) : dans le cas de 
figure II, nous avons remplacé le vecteur CD par le 
vecteur équipollent AC’. 

Morphismes et opérateurs linéaires. 

Pour la définition générale des morphismes, voir 
p. 38. 

• Morphismes d’espaces vectoriels. Soit E et F 
deux espaces vectoriels sur un même corps K ; nous 
appellerons x 1f x 2 , ... les vecteurs appartenant à 
l’espace E et y 1t y 2 , ... les vecteurs appartenant à F. 
Considérons l’application E —^ F qui fait correspon¬ 
dre à tout x E E un vecteur y E. F image de x dans 
l’application co, image que nous noterons œ(x), sym¬ 
bole qu’il faut lire « oméga de x ». 

Soit deux éléments x , x 2 €E E, et deux éléments 
a v a 2 E K. La loi de composition externe définie sur E 
et appliquée à x : et x 2 donne a 1 x : et a 2 x 2 ; la loi de 
composition interne (addition) appliquée à ces deux 
vecteurs donne finalement le composé a^x^ + a 2 2 , 
qui est une combinaison linéaire très simple des 


vecteurs x 1 et x 2 . L’application E F transforme ce 
vecteur en <o(a 1 x 1 + a 2 x 2 ). Si : 


(o(a 1 X 1 + a 2 x 2 ) = a 1 co(x ^ 4- or 2 <o(x 2 ), (34) 

alors l’application co est un morphisme de l’espace E 
dans l’espace F (ce qui peut se résumer grossièrement 
par la formule : « l’image du composé est le composé 
des images »). 

— Si E s’applique sur tout l’espace F, le mor¬ 
phisme (x) est un épimorphisme. 

— Si le morphisme œ est une application injec- 
tive, c’est-à-dire si à deux éléments distincts x 1 et x 2 de 
E correspondent deux images distinctes cd(x/) et o/(x 2 ) 
de F, c’est un monomorphisme. 

— Si le morphisme co est à la fois un épimor¬ 
phisme et un monomorphisme, c’est un isomorphisme. 

— Remarque : un morphisme d’espace vectoriel 
est souvent noté : 

œ \ E —> F. (35) 

• Opérateurs linéaires. Un morphisme d’espace 
vectoriel est souvent appelé un opérateur linéaire. 
Dans ce cas, au lieu d’écrire le morphisme sous la 
forme co : E —> F, ce qui conduit à noter co(x) l’image de 
x dans l’application co , on écrit A : E—► F, et on appelle 
A un opérateur linéaire. L’image de x est alors écrite 
A x et la condition (34) s’écrit : 

A(ot A x A + y. 2 x 2 ) = «i Ax, + a 2 Ax 2 . (36) 


Nous n’approfondirons pas ici la théorie des opéra¬ 
teurs linéaires ; nous nous contenterons d’en donner 
quelques définitions qui seront utilisées ultérieure¬ 
ment. 


— L’opérateur A qui, à tout x E E, fait corres¬ 
pondre le vecteur nul 0 de F véfifie la condition (36), 
c’est donc un opérateur linéaire : on l’appelle opéra¬ 
teur nul. 

— L’opérateur A qui, à tout x E E, fait corres¬ 
pondre le vecteur x E E est aussi un opérateur 
linéaire : c’est l’ opérateur unité (identité). 

— Si E est un espace vectoriel de dimension 
finie n et si F est un espace vectoriel à une seule 
dimension (par exemple : F = IR), l’opérateur linéaire A 
qui applique E dans F est appelé forme linéaire. 

— On peut définir la somme /4 1 + A 2 de deux 
opérateurs linéaires et le produit c*A d’un opérateur 
linéaire par un nombre a selon les règles suivantes : 


(A, + A 2 ) x = A,x + A 2 x ; 

(aA) x = a(Ax). ( 37 ) 


On montre alors que l’ensemble des opérateurs A : , 
A 2 , ... qui applique E dans F est lui-même un espace 
vectoriel, qui admet l’opérateur nul comme élément 
neutre pour l’addition. 

— Si E, F, G sont trois espaces vectoriels, A et B 
deux opérateurs linéaires définissant les applications 


C’est à l’époque où la comtesse de Ségur écrivait Les petites filles modèles (ci-dessous : illustration de Bertall 
pour l’édition originale de 1858) que s’est constituée l’algèbre moderne, avec les travaux de Hamilton, 

Grassmann, Riemann, Boole, etc. 



A : E —» F et B : F —► G, alors l’opération P . E —» G est 
appelée produit AB des opérateurs A et B, pris dans 
cet ordre. On a : 


Px = A(Bx). (38) 

— Soit A un opérateur tel que A : E F et B un 
opérateur linéaire tel que E:F->E; appelons U E 
l’opérateur identité dans E. Alors, si : 

BA = U E , (39) 

B est appelé inverse à gauche de l’opérateur A et A est 
l’inverse à droite de l’opérateur B. 

Algèbres. 

Si, dans un espace vectoriel E sur un corps K, on 
définit une deuxième loi de composition interne appe¬ 
lée multiplication , telle que x x y (ouxy) soit un 
élément de E, et si cette loi satisfait en outre aux 
axiomes suivants, l’espace vectoriel E est appelé une 
algèbre associative (ne pas confondre ce mot, qui est 
pris au sens d’un ensemble possédant au moins deux 
lois de composition interne, avec le sens technique 
ordinaire) : 

f 9 - oc(xy) = (ax) y = X(aÿ) . 
pour tout x, y, zE E J 10 - (xy)z =x(yz). .... 

et ot EK |11-(x+. y) z=xz + yz. 

U2 - x (y +z ) = x y+x z 

Les axiomes ont été numérotés 9 à 12, les huit 
premiers étant ceux d’un espace vectoriel, énoncés 
aux équations (4). Les axiomes 9 et 10 sont appelés 
lois associatives de l’algèbre considérée (elles concer¬ 
nent la loi de composition externe ax et la multiplica¬ 
tion), les axiomes 11 et 12 sont les lois distributives. 
L’algèbre est dite non commutative si, en général, 
xy^yx et commutative si xy= y x. Une algèbre pos¬ 
sède un élément neutre 0 pour l’addition et un élément 
neutre e (= unité) pour la multiplication (ne pas le 
confondre avec l’élément unité 1 du corps K sur lequel 
est construit l’espace vectoriel E). Deux éléments xet y 
sont symétriques pour la multiplication ( inverses) si 
xy = yx= e. 

Lattis et algèbres booléennes. 

Nous allons maintenant étudier deux structures très 
générales : le lattis (ou treillis, ou ensemble réticulé) et 
les algèbres booléennes, qui sont des lattis parti¬ 
culiers. C’est le logicien et mathématicien anglais 
George Boole (prononcez « Boule ») qui, le premier, a 
étudié un cas particulier de lattis ; ses travaux remon¬ 
tent aux alentours de 1850 ( Analyse mathématique de 
la logique, 1847 ; Investigations des lois de la pensée, 
1854). Dedekind a introduit la notion plus générale de 
lattis une trentaine d’années plus tard. 

Lattis. 

Le lecteur est prié de se reporter p. 17, pour revoir 
éventuellement la définition d’un ensemble ordonné, 
totalement ou partiellement, selon une relation d’ordre 
R \ x, y \ écrite conventionnellement « x y » ( ou, 
d’une façon synonyme : « y ^ x ») et celles de 
majorant, de minorant, de borne supérieure et 
de borne inférieure d’une partie A d’un ensemble 
ordonné E. 

• Définition. Un lattis est un ensemble E partiel¬ 
lement ordonné dans lequel toute partie A = { x, y} à 
deux éléments admet une borne supérieure et une 
borne inférieure dans E. Nous écrirons : 

a = x a y, (1) 

pour exprimer que a est la borne inférieure de { x, y} ; 
et : 

b = xvy, (2) 

pour exprimer que b est la borne supérieure de { x, y}. 

• Exemples. 

— Soit l’ensemble N* des entiers naturels 
ordonné par la relation « m divise n ». Considérons 
une partie A de N* à deux éléments, a — {x, y). 
Donnons par fantaisie au symbole « » le sens de « est 

diviseur de » ; on écrira donc : 

m divise n ou m n . (3) 

(Attention : avec la convention de notation des rela¬ 
tions d’ordre, « » ne signifie nécessairement pas que 

m est un nombre inférieur à n, bien que ce soit 
toujours le cas ici.) Pour voir si l’ensemble N* est un 
lattis, examinons l’existence de bornes inférieure et 
supérieure pour l’ensemble à deux éléments A. 

1 - Soit a un minorant de A, cela signifie que a 
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minore aussi bien x que y, c’est-à-dire que a est un 
diviseur commun pour x et y. La plus grande valeur 
possible de a est le PGCD de x et y : c’est la borne 
inférieure a de l’ensemble A. 

2 - Soit maintenant (3 un majorant de A ; on doit 
avoir « x diviseur de (3 » et « y diviseur de (3 » : donc (3 
est un multiple commun de x et de y. Le plus petit 
majorant possible est le PPCM de x et y : c’est la borne 
supérieure b de l’ensemble A. 

Tout ensemble A { x, y} partie de N* admettant une 
borne inférieure et une borne supérieure pour la 
relation m ^ n (« » = « est diviseur de »), il en résulte 

que N* muni de cette relation d’ordre est un lattis. 

— Soit E un ensemble et &(E) l’ensemble des ■§ 
parties qui lui correspond (voir la définition p. 15). | 
L’ensemble 2A(E) est partiellement ordonné pour la * 
relation « est inclus dans », que nous noterons | 
indifféremment à l’aide du symbole « C » ou du | 
symbole « ^ ». On sait que l’ensemble 2P (E) est @ 
constitué par : 1° l’ensemble vide 0 ; 2° les ensem- ^ 
blés { x }, { y }, ..., à un élément; 3° les ensembles c 

{ x, y }, { x, z }. à deux éléments; 4° les | 

ensembles à trois, quatre, cinq, ... éléments;^ 
5° l’ensemble E lui-même. C’est-à-dire que SP (E) est ^ 
constitué par toutes les parties A, B, C, ... de E, en y § 
incluant l’ensemble vide et l’ensemble E. Considérons ^ 
une partie si de SP (E) contenant deux éléments de SP 1 
(E), par exemple si = { A, B }. .s 

1 - Tout ensemble a inclus dans A et dans B est £ 
inclus dans l’intersection A H B des deux ensembles A | 
et B : l’ensemble A n B est le plus grand possible pour È 
la relation d’inclusion, c’est-à-dire la borne inférieure | 
de A. 

2 - Toute partie /3 dans laquelle sont inclus A et 
B, est un majoranf pour A ; l’ensemble A U B est le 
plus petit de ces majorants pour la relation d’inclu¬ 
sion : c’est la borne supérieure de A. 

Toute partie A de l’ensemble O'(E) possédant une 
borne inférieure et une borne supérieure, l’ensemble 
des parties (T(E) est un lattis. 

• Axiomes de la structure de lattis. Nous avons 
dit qu’un ensemble était un lattis si, et seulement si, 
chaque couple { x, y} de cet ensemble possédait une 
borne inférieure a = x a y et une borne supérieure 
b = x v y. Pour définir un lattis, il faut donc se donner 
une relation d’ordre et deux opérations binaires v 
(union) et a (intersection) déterminant respectivement 
la borne supérieure et la borne inférieure de tout 
couple {x, y} appartenant à E. Ces opérations ont les 
propriétés de l’union et de l’intersection des ensembles 
(voir pp. 15-16), à savoir : 


axiomes Pro P rlétés Opération v Opération a 


Commuta¬ 



tivité 

x v y = y v x 

x a y = y a x 

Associa¬ 

(x v y)vz = 

(x a y) A z = 

tivité 

x v (y V z) 

X A (y A z) 

Idempotence 

X V X = X 

X A X = X 

Absorption 

(x v y) A x = x 

(x a y) v x = x 


• Principe de dualité. Le lecteur a sans doute 
remarqué que les axiomes 1 à 4 sont doubles et portent 
sur les deux opérations v et a. Le principe de dualité 
dit que si une proposition p peut être déduite des 
axiomes 1 à 4, alors on peut établir la proposition p', 
obtenue en intervertissant v et a dans p. La proposi¬ 
tion p' est duale de p. 

Par exemple, on peut montrer dans certains cas que 
a est une opération distributive par rapport à v, 
c’est-à-dire que pour tout x, y, z d’un lattis, on a : 

x a (y v z) = (x a y) v (x a z). (5) 

Le dual de cet énoncé est donc vrai lui aussi et 
s’écrit : 



George Boole (1815-1864). 


Algèbres de Boole. 

• Définition. Si un ensemble E partiellement 
ordonné possède une structure de lattis, c’est-à-dire 
s’il est muni de deux lois de composition interne 
binaires a et v satisfaisant les axiomes (4) ci-dessus, et 
si de plus : 1° les opérations a et v sont doublement 
distributives ; 2° il existe une opération x—>x' faisant 
correspondre à tout xG E un élément x'G E appelé 
son complément dans E ; 3° E contient un plus grand 
élément 1 et un plus petit élément 0 (« > » et « < » 
devant être compris au sens de la notation des rela¬ 
tions d’ordre) : alors le lattis est une algèbre booléenne 
(ou une algèbre de Boole). 

• Exemples. 

— Soit l’ensemble B = {0, 1}, muni des lois v, 
a, ', ainsi définies : 

v (union ou addition) : par la table d’addition donnée 
p. 42, relative à l’exemple « électrique » ; 

a (intersection ou multiplication) : par la table de 
multiplication donnée au même paragraphe : 

' (complémentation) : par 0' = 1 ; V = 0. 

1 - Les lois de composition interne v et a sont 
commutatives, associatives, idempotentes et absorpti- 
ves (on le vérifie directement) : donc B est un lattis. 

2 - v et a sont doublement distributives. 

3-11 existe une troisième loi, unaire (= portant 

sur un seul élément) : la complémentation notée : 

4 - Le plus grand élément est 1 ; le plus petit 
élément est 0. 

Les propriétés 2, 3 et 4 ajoutées à la propriété 1 
montrent donc que B est une algèbre de Boole. 

— L’ensemble (P(E) des parties d’un ensemble 
est une algèbre de Boole. En effet : 

1 - (T(E) muni des opérations U et n, définies en 
théorie des ensembles, est un lattis. 

2 - U et n sont doublement distributives. 

3 - La troisième loi : ' est la complémentation 
dans E (voir p. 16). 

4 - Le plus petit élément de ^(E) est l’ensemble 
vide 0, et le plus grand élément de (T(E) est l’ensem¬ 
ble E lui-même. 


x v (y a z) = (x v y) a (x v z). (6) 

• Modularité. Les lattis les plus importants en 
algèbre ne sont pas distributifs ; toutefois ils vérifient 
souvent une condition plus faible que la distributivité et 
qu’on nomme la modularité ; on l’exprime ainsi : 

si x y , alors x v (y a z) = y a (x v z). (7) 

Si la condition de modularité (7) est vérifiée, le lattis 
est dit modulaire. La condition duale est : 

si y ^ x , alors x a (y v z) = y v (x a z) . (8) 


Résumé et conclusion. 

Résumé. 

• La structure d’un ensemble E est déterminée 
par les lois de composition (interne ou externe) défi¬ 
nies sur cet ensemble et par leurs propriétés. 

• Nous avons décrit huit types de structures, les 
structures : de monoïde, de groupe, d’anneau, de 


corps, de module sur un anneau, d’espace vectoriel 
(module sur un corps), de lattis, d’algèbre booléenne. A 
ces structures principales on peut ajouter des structu¬ 
res dérivées : sous-monoïde, sous-groupe, idéal d’un 
anneau, sous-corps, sous-espace vectoriel, etc. 

• Les lois de composition interne étudiées ont 
été nommées : addition ou union, multiplication ou 
intersection, complémentation ; elles sont respective¬ 
ment notées : 

-l- ou v ou U ; x ou a ou n ; ' ; 

ou d’une manière générale par des symboles tels que : 

_L, T, iJ\ etc. 

La description technique des lois de composition 
impose d’indiquer le procédé par lequel on obtient le 
composé z = x 1 y (table d’addition, table de multipli¬ 
cation, construction géométrique, etc.). 

• La description d’une structure impose de 
définir des éléments particuliers : les éléments neutres 
pour les opérations considérées (notés en général 0 
pour l’addition et 1 pour la multiplication) et d’exami¬ 
ner l’existence ou la non-existence d’éléments symétri¬ 
ques (- x, x -1 ). 

• L’application f d’un ensemble E dans un 
ensemble F impose d’étudier l’image dans F du 
composé x _L y de deux éléments appartenant à E pour 
une loi X. Si f satisfait à certaines conditions, énon¬ 
cées p. 38, c’est un morphisme. Les cas particuliers 
où le morphisme considéré est un isomorphisme est 
particulièrement fécond. 

• On peut définir, dans un ensemble E muni 
d’une structure (S), une relation d’équivalence 
R { x, y } notée x = y. Cette relation dépend, évidem¬ 
ment, de la nature des objets constituant l’ensemble E. 
Par exemple, dans l’ensemble Z des entiers, on définit 
la congruence a = b (mod p) comme le fait pour a - b 
d’être divisible par p ; dans un espace vectoriel E la 
relation d’équivalence x = y (mod A) signifie que le 
vecteur x - y appartient au sous-espace vectoriel A. 

Tous les éléments équivalents à un même élément a 
constituent une classe d’équivalence a. 

Conclusion. 

Les mathématiques sont l’art du calcul, en prenant le 
terme au sens général de « combinatoire ». L’arithmé¬ 
tique calcule sur des nombres entiers ou rationnels, 
l’algèbre (au sens le plus général) calcule sur des 
ensembles, sur des opérations, sur des implications ; 
l’analyse calcule sur les nombres réels, les nombres 
complexes, les fonctions, les infiniment petits, etc.; la 
géométrie calcule sur des ensembles de points ; la 
topologie calcule sur des configurations, etc. 

L’intérêt de la considération de la structure d’un 
ensemble dans lequel on calcule est multiple. 

1 - On détermine d’emblée les règles générales 
de tout calcul, sans avoir besoin de le démontrer pour 
chaque théorie particulière ou pour chaque cas parti¬ 
culier. 

2 - L’utilisation de certaines structures et de 
leurs propriétés permet de résoudre des problèmes 
fondamentaux de l’algèbre ou de l’analyse (par exem¬ 
ple les propriétés du groupe de substitutions facilitent 
l’étude des équations du n-ième degré). 

3 - Les liens de parenté entre diverses théories 
mathématiques deviennent évidents quand on examine 
les structures qui leur correspondent. C’est grâce à 
l’algèbre des structures, notamment, qu’on a pu géné¬ 
raliser la notion de nombre (des entiers naturels aux 
idéaux, en passant par les réels et les complexes), et de 
vecteurs (à 2, 3, .... n dimensions, et les tenseurs). 

4 - Grâce à l’algèbre des structures, l’édifice des 
connaissances mathématiques est plus cohérent, plus 
général, plus rigoureux. En revanche, le raisonnement 
mathématique est plus abstrait, et, en apparence, plus 
éloigné des applications physiques, techniques, etc. 
Cet inconvénient disparaît, évidemment, après un peu 
de pratique. 

5-11 n’est pas inutile de rappeler que les princi¬ 
pales structures algébriques ont été définies entre 1830 
et 1880 environ. L’algèbre dite moderne est celle de 
nos arrière-arrière-grands-parents, contemporains des 
révolutions de 1848, de la formation de l’empire alle¬ 
mand, de l’unité italienne, du Second Empire, de la 
Commune de Paris, du triomphe de la machine à 
vapeur, des crinolines, de l’Impressionnisme, des opé¬ 
ras de Wagner, de l’élaboration et de la diffusion du 
Capital, de l ’Internationale ouvrière et des premiers 
mouvements anarchistes. Elle est antérieure à la psy¬ 
chanalyse (née en 1885), à la physique relativiste (née 
en 1905), à la physique atomique et nucléaire (qui se 
développe entre 1895 et 1920), à la physique quantique 
(élaborée entre 1920 et 1930). 
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LA NOTION DE NOMBRE RÉEL 

NOMBRES RÉELS 
ET NOMBRES COMPLEXES. 


Nous avons déjà rencontré les nombres réels et les 
nombres complexes pp. 31-32. Ce sont là des êtres 
mathématiques d’une importance capitale : toute l’algè¬ 
bre classique, élémentaire ou supérieure, l’analyse, 
l’algèbre linéaire, etc., conduisent à calculer — au 
sens large — dans ces ensembles. Avant de poursui¬ 
vre notre exposé des connaissances mathématiques, 
il nous faut donc définir les réels et les complexes 
avec plus de rigueur et de précision que nous ne 
l’avons fait jusqu’à présent. 


Rappel historique. 

La notion de nombre réel. 

Le « nombre » par excellence, sur lequel on calcule, 
que l’on combine, que l’on met en rapport dans des 
équations avec d’autres « nombres >> connus ou incon¬ 
nus, c’est le nombre entier positif, c’est-à-dire Y entier 
naturel. Nous l’avons vu, p. 25, qu’on peut définir 
l’ensemble N des entiers naturels et du zéro par un 
système d’axiomes, décrivant leurs propriétés fonda¬ 
mentales et à partir desquelles toutes les autres 
propriétés — dont l’ensemble constitue l’ arithmétique 
ou la théorie des nombres — peuvent être déduites. 
Vingt-deux siècles environ séparent la première tenta¬ 
tive de définition axiomatique des entiers (par Euclide, 
qui reprend Eudoxe) des axiomes de Peano (1889), 
dont on fait classiquement usage pour définir l’ensem¬ 
ble N. Au cours des âges (voir p. 7) et pour les besoins 
de l’algèbre — considérée comme la théorie des 
équations — ont été introduits les nombres fraction¬ 
naires, les nombres négatifs, les irrationnels et les 
nombres complexes, dont nous ne parlerons d’ailleurs 
pas pour l’instant. L’ensemble des rationnels (positifs 
et négatifs) et des irrationnels constitue l’ensemble 
des réels. 

• Définition par la théorie de la mesure. C’est 
encore à Euclide qu’il faut remonter si l’on veut une 
première définition axiomatique des réels, définition 
qui reprend les théories d’Eudoxe. Pour les Anciens, 
un nombre réel est un symbole exprimant la mesure 
d’une grandeur (une longueur, une surface ou un 
volume par exemple). Les nombres rationnels sont 
représentables par des segments divisibles en unités et 
en fractions d’unités ; les irrationnels sont aussi repré¬ 
sentables par des segments, ainsi la diagonale d’un 
carré dont le côté est égal à l’unité représente l’irra¬ 
tionnel V2. De ce point de vue, la définition du nombre 
réel en tant que telle est esquivée, et seules sont 
conservées les règles axiomatiques de calcul. Dans le 
Livre I des Arithmétiques de Diophante d’Alexandrie, 
on trouve une introduction ample définissant les diver¬ 
ses catégories de réels et les règles de calcul les 
concernant. Cette attitude a persisté jusqu’au début du 
XIX e siècle où l’on se contentait encore de la définition 
d’Isaac Barrow (le maître de Newton) : les nombres 
réels sont des symboles traduisant des rapports de 
grandeurs — commensurables ou incommensurables 
— et susceptibles de se combiner entre eux selon les 
lois de l’arithmétique. Cet état d’esprit va être celui de 
tous les mathématiciens jusqu’aux travaux de Gauss 
sur les séries convergentes. 

• Les réels considérés comme la limite d’une 
série convergente. A partir du XIX e siècle — tout 
particulièrement à partir d’un mémoire de Gauss sur 
les séries hypergéométriques (1812), on ne se contente 
plus de cette définition opérationnelle des réels. Il y a à 
cela deux raisons : 

1 - la théorie des fonctions, élaborée au 
XVIII e siècle, a porté au premier plan de la réflexion 
mathématique les problèmes relatifs aux séries conver¬ 
gentes, à la continuité, à la notion de limite ; 

2 - la valeur numérique d’une fonction est un 
nombre réel qui peut se calculer, dans le cas le plus 
général, en remplaçant la fonction par une somme de 
termes, qu’on appelle une série ; le nombre réel équi¬ 
valent à la fonction est la limite, si elle existe, vers 
laquelle tend cette série lorsque le nombre de termes 
augmente indéfiniment. 

Sans anticiper sur ce qui sera dit ultérieurement en 
analyse, expliquons-nous succinctement. Une série 
numérique est la somme des termes a v a 2 , ... formant 
une suite. Par exemple : 

1 + X + X 2 + X 3 + •* * ■ + X n_1 + •*• (1) 

est une série numérique, dans laquelle x est un nombre 
déterminé. Le premier terme de la série est 1 ; le 
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deuxième terme de la série est x ; le troisième terme de 
la série est x 2 ; ... le n-ième terme de la série est x n ~\ Si 
x est un nombre supérieur à 1, chaque terme est 
supérieur au précédent, et la somme (1) augmente en 
même temps que n et tend vers l’infini quand n 
augmente indéfiniment : on dit que la série diverge ou 
est divergente. En revanche, si x est inférieur à 1, 
chaque terme est plus petit que le précédent. Par 
exemple, pour x = 1/2, (1) s’écrit : 


-H 


i i 
8 + 16 + 


1 


En formant les sommes partielles : 

s i = 1, 

s 2 


„ 1 3 

' — 1 + 2 ~ 2 ’ 


, 1 1 7 

83-1 + 2 + 4“4' 
S4 _ 1+ 1 + 1 + 1 
2 4 8 


15 
8 ’ 


( 2 ) 


(3) 


etc., 


on constate (mais ce n’est pas une démonstration), 
que la somme s n se rapproche de plus en plus de 2 au 
fur et à mesure que n augmente. Il est donc tentant de 
dire que s = 2 est la valeur limite qu’atteindra la 
série (2) si on la prolonge à l’infini. Si l’on succombe à 


cette tentation, on dira que la série est convergente et 
que sa somme est la limite s = 2. 

Au XVII e et au XVIII e siècle, bien des mathématiciens 
ont succombé à la tentation de l’intuition et ils ont 
affirmé la convergence de séries variées, sans apporter 
aucune rigueur logique à ces affirmations. Newton 
lui-même croyait que n’importe quelle fonction pouvait 
se mettre sous la forme d’une série de puissances et les 
règles de convergence employées résultaient souvent 
d’actes de foi plus que de raisonnements déductifs. 
Dès lors, la définition d’un nombre irrationnel comme 
la limite d’une série convergente ne peut être guère 
prise au sérieux : ainsi, on savait depuis le XVI e siècle 
(Bombelli) que \/2 peut se calculer avec autant de 
précision que l’on désire par la fraction prolongeable à 
l’infini : 


1 + ■ 


2 + 


2 + 


2 + 


(4) 


2 + 


2 + ■ 


2 + 


2 + ... 
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Mais cela ne constitue pas une définition rigoureuse 
de V2, car il faudrait démontrer que l’expression (4) 
tend vers une limite finie ; pour cela il faut disposer 
d’une définition claire et distincte de la notion de 
limite. 

Ainsi donc, dans la mesure où l’on peut définir un 
nombre réel en se fondant sur la notion de suite, de 
série convergente, de continuité et de limite, il faut 
commencer par définir ces notions. C’est cette rigueur 
qu’introduit Gauss dans son mémoire de 1812 pour 
calculer une fonction appelée série hypergéométrique, 
et qu’on retrouve en 1817 dans un mémoire célèbre sur 
la définition de la continuité des fonctions, dû au 
mathématicien et logicien italo-tchèque (... mais qui 
écrivait en allemand), B. Bolzano. Toutefois c’est à 
Cauchy ( Cours d’Analyse de l’École Polytechnique, 
1821) que revient le mérite d’avoir établi d’une façon 
rigoureuse la théorie des séries. Donnons-lui la 
parole : 

«... Avant d’effectuer la sommation d’aucune série, 
j’ai dû examiner dans quels cas les séries peuvent être 
sommées, ou, en d’autres termes, quelles sont les 
conditions de leur convergence ; et j’ai, à ce sujet, 
établi des règles générales qui me paraissent mériter 
quelque attention. » 

Parmi ces « règles générales », il y a le fameux 
« critère de Cauchy » (qui ne s’applique, en fait, qu’à 
certaines suites dites « suites de Cauchy ») et que son 
auteur énonce de la manière suivante : 

« Pour que la série soit convergente, il est d’abord 
nécessaire que le terme général U n décroisse indéfini¬ 
ment tandis que n augmente ; mais cette condition ne 
suffit pas, et il faut encore que pour des valeurs 
croissantes de n, les différentes sommes : 

U n + U n+ , , 

U n + U n +1+ U n+2 , 

etc. 

c’est-à-dire les sommes des quantités U n , U n+A , U n+2 , 
etc., prises, à partir de la première, en tel nombre que 
l’on voudra, finissent par obtenir constamment des 
valeurs numériques inférieures à toute limite assigna¬ 
ble. Réciproquement, lorsque ces diverses conditions 
sont remplies, la convergence de la série est assurée. » 

Les idées de Cauchy furent précisées par Abel 
(1826), et un demi-siècle plus tard, par Weierstrass, 
Dedekind, Méray et Cantor. On aboutit ainsi à diverses 
définitions possibles (et équivalentes) des réels, à 
partir des nombres rationnels. 

• La mise en ordre axiomatique de ces connais¬ 
sances a eu lieu dans les vingt dernières années du 
XIX e siècle. A partir du moment où l’on définit l’ensem¬ 
ble des réels en partant de l’ensemble des rationnels, 
l’ensemble des rationnels en partant de l’ensemble des 
entiers (positifs et négatifs), et l’ensemble des entiers à 
partir de l’ensemble N des entiers naturels, il fallait 
avant toute chose axiomatiser l’ensemble N. C’est ce 
que firent Dedekind (1888) et Peano (1889-1891). 

Il faut donc bien comprendre le processus qui 
aboutit à la définition des réels : 


Giuseppe Peano (1858-1932). Ce mathématicien a 
inventé un système de signes permettant d’énoncer 
les propositions logiques et mathématiques, la pasi- 
graphie (étymologiquement : « l’art de tout écrire »). 



1 - les nombres rationnels sont définis axiomati- 
quement, par référence, en dernière analyse, à 
l’ensemble N des entiers naturels, lui-même défini par 
les axiomes de Peano énoncés p. 25. 

2 - les irrationnels peuvent alors être définis par 
diverses méthodes, faisant intervenir la notion de 
continuité, et fondées soit directement sur la théorie 
des séries (Cauchy), soit sur la notion de coupure dans 
un ensemble (Dedekind). 

Nous donnons ci-contre et p. 54, la définition des 
nombres réels proposés par Dedekind en 1872 dans 
Stetigkeit und irrationale Zahlen (Continuité et nom¬ 
bres irrationnels). Signalons qu’on peut aussi définir 
les réels sans se référer aux rationnels (Hilbert, 1900). 

La notion de nombre complexe. 

L’histoire des nombres complexes a déjà été racon¬ 
tée (voir p. 12). Introduits par les algébristes italiens 
du XVI e siècle (et en particulier par Bombelli) pour 
résoudre les équations du 3 e et du 4 e degré à une 
inconnue, les nombres complexes ont embarrassé les 
mathématiciens jusqu’au début du XIX e siècle. Leur 
théorie a été faite d’une manière définitive par Gauss 
et par Hamilton. Voici un résumé chronologique relatif 
à la théorie des nombres complexes. 


Dates Événements 


1579 Bombelli décrit et utilise des nombres imagi¬ 
naires dans son Algebra. 

1673 Wallis tente de déterminer une représentation 
géométrique des nombres complexes. 

1677 , Le i b n i z dém ontre que le nombre 

Va 4- b\ + Va - b i est réel. (Nous utilisons la 
notation moderne ; en fait Leibniz n’utilisait pas 
le symbole i, qui ne fut introduit qu’en 1750 par 
Euler.) 

1702 Leibniz et Jean Bernoulli introduisent le 
concept (discuté) de logarithme d’un nombre 
imaginaire. 

1714 L’Anglais Roger Cotes énonce la formule 
célèbre ix = Ig (cos x + i sin x). 

1730 De Moivre établit la formule : 

(cos x + i sin x) n = cos nx + i sin nx. 

1746 D’Alembert démontre que tous les nombres 
imaginaires sont de la forme a + b i. 

1748 Euler démontre les formules célèbres : 

e ix = cos x + i sin x et e i1T = - 1 . 

1750 Euler introduit le symbole i. 

1751 Euler montre que tout nombre imaginaire 
possède, comme tout nombre réel, une infinité 
de logarithmes. 

1797 Gauss découvre la représentation géométri¬ 
que des nombres complexes, encore admise 
aujourd’hui (voir p. 56) ; toutefois il ne vulgarise 
pas immédiatement sa découverte. 

1797 Le Danois Caspar Wessel propose une repré¬ 
sentation géométrique des nombres complexes, 
analogue à celle de Gauss (qu’il ignorait) ; cette 
découverte passa inaperçue en son temps. 

1806 J.-R. Argand établit à son tour la représenta¬ 
tion géométrique des nombres complexes, sur 
des méthodes analogues à celles de Gauss et de 
Wessel : les nombres complexes sont représen¬ 
tés par les points d’un plan rapporté à deux 
axes Ox et Oy. 

1814- Polémique dans les Annales, publiées par le 

1815 mathématicien français Gergonne, au sujet de la 
représentation géométrique des complexes par 
la méthode de Wessel. 

1828 Warren, reprenant les théories géométriques 
précédentes, justifie les propriétés des opéra¬ 
tions sur les nombres complexes en les rame¬ 
nant à des transformations géométriques dans 
le plan (déplacements et similitudes). 

1831 Gauss invente l’expression nombre complexe 
(Théorie des résidus biquadratiques) pour 
décrire les nombres de la forme a + b\. 

1833 Théorie définitive des nombres complexes par 
Hamilton : un nombre complexe est un couple 
de réels (a, b). L’addition et la multiplication de 
ces êtres mathématiques se définit par : 

(a, b) + (a', b') = (a + a', b + b') ; 

(a, b) (a', b') = (aa' - bb', ab' + ba'). 

Cette définition générale des complexes 
conduira Hamilton à la théorie des quaternions. 


LE CORPS U DES NOMBRES REELS 

Le corps K des nombres réels. 

Une définition simple des réels. 

Voici la définition due à Dedekind ; nous donnerons 
d’abord la définition de V2, puis la définition générale 
des réels. 

• Définition de V2. Soit l’ensemble Q des 
entiers et fractions positifs et négatifs et du zéro. Rien 
ne nous interdit de les ranger en deux classes dis¬ 
tinctes : 

tous les nombres négatifs ; 

— 1» classe 16 Zér ° ; 

< les nombres rationnels positifs 

a dont le carré a 2 est plus petit 

que 2. 

— 2 e classe : tous les autres nombres. 

Cette division est telle que l’on peut choisir un 
nombre a de la première classe et un nombre b de la 
deuxième classe tels que la différence (b - a) soit aussi 
petite que l’on veut (on exprime cette condition en 
disant que Vécart des deux classes est nul). On dit 
qu’on a effectué une coupure dans l’ensemble des 
nombres rationnels. Il est facile de constater qu’il 
n’existe pas, dans la première classe, un nombre 
supérieur à tous les autres. En effet, supposons que ce 
nombre existe ; nommons-le x. Puisqu’il appartient à 
la première classe, on doit avoir : 

x 2 < 2 . (1) 

Par ailleurs, tout nombre b>x appartiendrait à la 
deuxième classe (puisque x est supposé être le plus 
grand nombre de la première classe). Or il est toujours 
possible — c’est ce que montre le calcul prolongé à 
l’infini de la racine carrée de 2 — de trouver un nombre 
b tel que b 2 soit compris entre x 2 et 2, c’est-à-dire tel 
que x 2 < b 2 < 2. Il existerait alors un nombre b tel que 
son carré soit inférieur à 2, donc appartenant à la 
première classe, et plus grand que x, donc plus grand 
que le plus grand nombre de la première classe, ce qui 
conduit à une contradiction. On aboutirait de la même 
façon à une contradiction si l’on supposait qu’il existe 
un nombre de la deuxième classe qui soit plus petit que 
tous les autres nombres de cette classe. En résumé, la 
coupure que nous avons réalisée sur l’ensemble des 
rationnels définit un nombre x qui ne peut être un 
nombre rationnel (c’est-à-dire qui n’appartient ni à la 
première classe, ni à la seconde). Le nombre défini par 
cette coupure se note V2 (lire : « racine de 2 ») ; nous 
sommes certains qu’il n’est pas rationnel et nous 
l’appelons, par conséquent, irrationnel. 

• Définition générale des réels. Divisons 
l’ensemble des rationnels en deux classes distinctes, 
non vides, telles que : 

1 - tout nombre inférieur à un nombre de la 
première classe appartient à cette classe, qui sera 
appelée classe inférieure I ; 

2 - tout nombre supérieur à un nombre de la 
seconde classe appartient à cette seconde classe, dite 
classe supérieure S ; 

3 - il est possible de choisir deux nombres a et b 
appartenant respectivement à la première et à la 
deuxième classe, tels que la différence (b - a) soit 
aussi petite que l’on veut. 

On a ainsi effectué une coupure dans l’ensemble des 
rationnels. 

— Les deux premières conditions nous mon¬ 
trent que tout nombre de la classe inférieure / est plus 
petit que tout nombre de la classe supérieure S et que, 
si un nombre n’est pas classé, il est supérieur à tout 
nombre de / et inférieur à tout nombre de S. 

— En vertu de la troisième condition, il existe au 
plus un nombre x non classé. En effet, s’il y en avait 
deux, x et y, la différence {b - a) serait supérieure à la 
valeur absolue | y — x |, quels que soient a et b choisis 
respectivement dans la classe inférieure et dans la 
classe supérieure, ce qui est en contradiction avec la 
troisième condition. 

En résumé, si l’on pratique une coupure dans 
l’ensemble des rationnels en respectant les trois condi¬ 
tions précédentes, quatre cas peuvent se présenter. 

— 1 er cas : il existe un nombre rationnel non 
classé, a. Cela signifie que les nombres de la classe 
inférieure sont les nombres rationnels inférieurs à a, et 
que les nombres de la classe supérieure sont les 
nombres rationnels supérieurs à a ; a détermine la 
coupure, et, inversement, la coupure définit a. 

— 2 e cas : il n’existe aucun nombre rationnel 
non classé, mais il existe dans / un nombre a supérieur 
à tous les autres. Dans ce cas, les nombres de la 
première classe sont les nombres inférieurs à a et a 
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Richard Dedekind (1831-1916). Elève de Gauss, il a 
apporté une importante contribution à la théorie des 
irrationnels en introduisant la notion de coupure ; 
il est, avec Cantor, le créateur de la théorie des 
ensembles. 


lui-même, et les nombres de la deuxième classe sont 
des rationnels supérieurs à a. La coupure est détermi¬ 
née par le rationnel a, et, inversement, a est défini par 
cette coupure. 

— 3 e cas : il n’existe aucun nombre rationnel 
non classé et il existe dans S un nombre a inférieur à 
tous les autres. Dans ce cas, les nombres appartenant à 
/ sont des rationnels inférieurs à a , et les nombres 
appartenant à S sont des rationnels supérieurs à a et a 
lui-même ; ici aussi, a détermine la coupure et, inver¬ 
sement, la coupure définit a. 

— 4 e cas : il n’existe aucun nombre rationnel 
non classé ; en même temps il n’existe pas dans / de 
nombre supérieur à tous les autres, ni dans S de 
nombre inférieur à tous les autres. Dans ce cas on dit 
que la coupure définit un nombre irrationnel (elle ne 
peut pas définir un nombre rationnel, puisque tous 
ceux-ci sont classés) considéré comme inférieur à tous 
les nombres de S et comme supérieur à tous les 
nombres de /. 

— L’ensemble des coupures ainsi définies, et 
qu’on nomme Vensemble (R, est \'ensemble des nom¬ 
bres réels ; il possède la structure de corps commu¬ 
tatif. 

Axiomes des nombres réels. 

Les propriétés des nombres réels découlent de leur 
définition. Il est commode toutefois de les présenter 
comme les conséquences d’un système d’axiomes 
explicitant cette définition qui sous-entend : 

1 - que l’ensemble U a une structure de corps 
commutatif, comme l’ensemble Q dont on est parti ; 

2 - qu’il est muni d’une relation d’ordre x ^ y 
pour tout couple (x, y) de nombres réels ; 

3 - qu’il s’agit d’un ensemble continu (ce qui 
permet de définir les irrationnels comme faisant partie 
des réels). 

• Axiomes de la structure de corps commutatif. 
Cette structure a été définie p. 43 : un corps commuta¬ 
tif est un ensemble muni de deux lois de composition 
interne (+ et x), associatives, commutatives et double¬ 
ment distributives, admettant l’une et l’autre un élé¬ 
ment neutre (respectivement : 0 et 1) et telles que 


chaque élément x G [R admet un symétrique dans U 
pour ces opérations (— x pour l’addirion et x” 1 pour la 
multiplication). Ces axiomes s’écrivent ainsi, en appe¬ 
lant x, y, z trois réels quelconques : 


1 - 

x + y 

= y + x ; 

2 - 

(x + y) + z 

= x + (y+z) ; 

3 - 

x + 0 

= 0 + x = x ; 

4 - 

x + (- x) 

= 0; 

5 - 

xy 

= yx; 

6 - 

(xy)z 

= x(yz) ; 

7 - 

1 x 

= x 1 = x ; 

8 - 

xfx- 1 ) 

= 1, pour tout x ^ 0 

9 - 

x(y + z) 

= xy + xz . 


• Relation d’ordre. Pour tout couple (x, y) de 
réels il existe une relation d’ordre notée : 

x *£ y (3) 

(la relation y 2 = x est synonyme de la relation x ^ y). 
Cette relation possède les propriétés suivantes, qui 
sont des axiomes d’ordre : 

1 10 - pour tout x, x x ; 

11 - x^yety^x implique x = y; 

12 - x^y et y^z implique x ^ z ; 1 ' 

13-0^x et 0 ^ y implique 0 ^ xy. 

otj 

ci En d’autres termes, l’ensemble IR est un ensemble 
^ totalement ordonné (voir la définition p. 17). 

© 

^ • Axiome de la borne supérieure. Tout 

^ sous-ensemble non vide A, appartenant à IR et qui 
c admet un majorant, possède une borne supérieure. 
£ Rappelons la définition du majorant et de la borne 
53 supérieure pour une relation d’ordre x y : 

J — Si pour tout x Œ A il existe y G IR, tel que 

& x =ss y, on dit que A est majoré par l’élément y, ou 
S encore que y est un majorant de A ; on peut écrire 
^ conventionnellement : 

I * « y ■ (5) 

3 Par exemple la partie A ={0, ...,10} de l’ensemble 
des réels contient tous les réels compris entre 0 et 10, y 
compris 0 et 10 eux-mêmes. Tout réel y supérieur ou 
égal à 10 est un majorant pour A, eu égard à la relation 
d’ordre « ». 

— S’il existe un majorant y 0 tel que, pour tout 
autre majorant y, on ait y 0 ^ y, alors y 0 est appelé la 
borne supérieure de l’ensemble A (dans l’exemple 
précédent, y 0 = 10). 

L’axiome de borne supérieure a pour conséquence 
deux propriétés très importantes connues sous le nom 
d’ axiome d’Archimède et d 'axiome de Cantor. En fait, 
dans la mesure où ces deux propositions sont des 
conséquences de l’axiome de la borne supérieure, ils 
n’ont pas droit à l’appellation « axiome ». Toutefois, 
très souvent, ils sont posés comme des axiomes ; alors 
l’axiome de la borne supérieure devient le théorème de 
la borne supérieure. L’intérêt capital de ces proposi¬ 
tions est qu’elles définissent la continuité de l’ordre 
numérique des réels et qu’elles permettent d’assimiler 
l’ensemble des réels à l’ensemble des points d’une 
droite. 


Conséquences des axiomes précédents. 

• Les axiomes d’addition et de multiplication 
(n os 1 à 9 ci-dessus) permettent de justifier : 

1 - les règles opératoires et la méthode de réso¬ 
lution des équations a + x = b et ax = b {b ^ 0), la 
première admettant la solution unique x = b - a et la 
seconde la solution unique x= b/a ; 

2 - la notation exponentielle et la règle 
x m x n = x m+n pour m et n entiers (c’est-à-dire apparte¬ 
nant à Z) ; 

3 - la règle d’absorption : si un produit de deux 
réels est nul, l’un au moins des facteurs est nul ; 

4 - toutes les règles opératoires sur les polynô¬ 
mes de l’algèbre élémentaire. 

• Les axiomes de la relation d’ordre (n os 10 à 13) 
ont pour conséquence les règles de transformation des 
inéquations (on peut faire passer un terme d’une 
inégalité dans l’autre en changeant son signe ; on peut 
multiplier les deux membres d’une inégalité par un 
même nombre positif sans changer le sens de l’inéga¬ 
lité ; on peut multiplier les deux membres d’une inéga¬ 
lité par un même nombre négatif à condition de 
changer le sens de cette inégalité ; etc.). 

• L’existence d’une borne supérieure pour 
toute partie non vide majorée de IR a de nombreuses 
conséquences très importantes, dont voici les princi¬ 
pales. 

— Pour tout x > 0 réel et pour tout n > 0 entier, 
il existe un réel y>0 et un seul tel que y n = x. Ce 


nombre est noté Vx (lire : « racine n-ième de x »). 

— Étant donné deux réels positifs x et y, on a : 

\fxÿ = S/x X/y et VVx = nX^xX (6) 

— « Axiome » d’Archimède : si x > 0 et pour 
tout y G IR, alors il existe un multiple entier nx du 
nombre x tel que : 

(n- 1) x*s y< nx. (7) 

Ainsi énoncé, l’axiome d’Archimède concerne la loi 
de composition additive des réels. Pour la multiplica¬ 
tion il s’énonce de la manière suivante: si x>1 et 
y>0, alors il existe un exposant nG Z tel que : 

X"' 1 *£ y, x n > y. (8) 

Parmi les conséquences de l’axiome d’Archimède on 
peut retenir les suivantes : 

1 - tout intervalle (a, b) de nombres réels 
contient au moins un nombre rationnel ; 

2 - on peut noter un nombre réel à l’aide d’un 
ensemble fini de symboles (pratiquement, on utilise le 
système décimal de numération, qui utilise les dix 
symboles 0, 1, 2, ..., 9). 

— Axiome de Cantor (appelé aussi principe des 
intervalles fermés emboîtés). Considérons dans 
l’ensemble des réels un ensemble d’intervalles noté / 1f 
/ 2 , ... tel que, pour tout couple d’intervalles l m etl n , l’un 
soit inclus dans l’autre, par exemple l m C l n ou l n c l m . 
Un tel ensemble d’intervalles est appelé système 
d’intervalles emboîtés. L’axiome de Cantor s’énonce 
ainsi : pour tout système d’intervalles fermés emboîtés 
[a, b], il existe au moins un nombre réel appartenant à 
tous les intervalles du système. On déduit de ce 
principe un certain nombre de conséquences, en 
particulier le théorème suivant : l’intersection d’un 
système d’intervalles fermés emboîtés est formée d’un 
seul nombre si, et seulement si, pour tout e > 0, il y a 
dans le système un intervalle [a, b] tel que b - a< e. 

• La droite numérique. Considérons un axe x' x 
défini par son origine, O, et orienté dans un certain 
sens (par exemple de la gauche vers la droite). On 
appelle abscisse d’un point M la mesure de la longueur 
OM avec une certaine unité, affectée du signe « + » si 
le point M est à droite de O et du signe « - » s’il est à 
gauche de O (avec la convention de sens précédem¬ 
ment indiquée). 

Pour interpréter géométriquement la définition de 
Dedekind, considérons l’ensemble des points de la 



droite x' x et pratiquons une coupure dans cet ensem¬ 
ble en choisissant arbitrairement un point a de cette 
droite. En s’aidant d’une figure, le lecteur constatera 
que les différents cas possibles envisagés dans la 
définition de Dedekind peuvent être retrouvés, à condi¬ 
tion de remplacer l’expression « ensemble des réels » 
par le terme « droite x' x » et les nombres réels par des 
points. Il est d’ailleurs classique, en mathématiques 
d’appeler l’ensemble IR de tous les nombres réels 
droite numérique, et les nombres réels eux-mçmes les 
points de cette droite. 

Nous pouvons retrouver une interprétation géométri¬ 
que de l’axiome d’Archimède et de l’axiome de Cantor. 

— Axiome d’Archimède : soit deux points a et b 
sur la demi-droite Ox, avec Oa < Ob. Construisons à 
partir de O, sur la demi-droite Ox, les segments 
Oa = aa 1 = a A a 2 = a 2 a 3 = ••• = a n _-, a n , tels que l’un 
quelconque des points a v a 2 , ... soit situé entre deux 
autres points analogues (par exemple a 2 entre a 1 et a 3 , 
a 4 entre a 3 et a 5 , a, entre a i _ 1 et a, +1 ). L’axiome 
d’Archimède consiste à affirmer qu’il existe un point a n 
tel que b soit entre O et a n (c’est ce qu’on appelle un 
ordre archimédien). 

— Axiome de Cantor : étant donné un nombre 
réel irrationnel défini par une coupure quelconque sur 
l’ensemble des rationnels, on admet qu’il existe un 
point a sur la droite x' x ayant pour abscisse ce 
nombre. 

Nombres algébriques et nombres transcendants. 

• Théorème de Cantor (1874). Nous avons 
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défini, p. 19, un ensemble dénombrable comme un 
ensemble équipotent à l’ensemble N* des en¬ 
tiers naturels, c’est-à-dire comme un ensemble E = 

{ a, b, ... } dont chaque élément peut être mis en 
correspondance biunivoque avec les éléments de 
l’ensemble l\l* = { 1, 2, 3, ... }. Autrement dit, si l’on 
associe l’élément a au nombre 1, l’élément b au 
nombre 2, etc., alors : 

1 - il est possible de numéroter tous les élé¬ 
ments de l’ensemble E à l’aide des nombres de 
l’ensemble N* ; 

2 - deux éléments distincts de E portent deux 
« numéros » différents ; 

3 - tout nombre appartenant à N* est appliqué 
sur un élément appartenant à E ; 

4 - deux nombres distincts sont appliqués à 
deux éléments distincts. 

Si un ensemble ne possède pas ces propriétés 
d’équipotence à N* il est dit non-dénombrable. 

Le théorème démontré par Cantor en 1874 s’énonce 
de la manière suivante : 

« L ensemble de tous les points (= de tous les nombres 

réels) de l’intervalle [0, 1] = 0 ^ x ^ 1 est non- 

dénombrable. » 

On démontre ce théorème à l’aide du principe des 
intervalles emboîtés (voir p. 54). Voici l’articulation de 
cette démonstration. 

1 - Supposons que l’ensemble des réels x tels 
que O^x^l soit dénombrable. Cela signifie qu’on 
peut associer les entiers N* à chaque réel x compris 
entre 0 et 1, en appelant x^ x 2 , ..., x n , ... ces nombres 
réels. Si l’ensemble [0, 1] est dénombrable, la suite x 1( 
x 2 , ... décrit tous les nombres de l’intervalle [0,1]. Nous 
allons démontrer qu’il existe au moins un nombre £ 
(c’est la lettre grecque ksi) de l’intervalle qui est 
différent de tous les x n de la suite considérée, donc 
que cette suite ne décrit pas tout l’intervalle [0,1], donc 
que cet intervalle est non-dénombrable. 

2 - Partageons l’intervalle [0, 1] entrois interval¬ 
les égaux [0, 1/3], [1/3, 2/3], [2/3, 1]. Les nombres 1/3 
et 2/3 sont des nombres frontières, communs l’un aux 
deux premiers intervalles et l’autre aux deux derniers 
intervalles. 

3 - Le nombre x 1 — c’est-à-dire le premier terme 
de la suite dénombrable — ne peut appartenir à la fois 
aux trois intervalles ; on peut donc choisir un inter¬ 
valle, que nous appellerons / 1t qui ne contient pas x., 
(ni à l’intérieur, ni sur la frontière), c’est-à-dire, en 
notation ensembliste, tel que x 1 £ 

4 - Partageons l’intervalle /., en trois intervalles 
égaux comme précédemment ; pour la même raison 
que précédemment, il y a un intervalle l 2 qui ne 
contient pas le nombre x 2 ; et ainsi de suite : l’intervalle 
/ 3 , partie de / 2 , ne contient pas x 3 ; ... l’intervalle / n+1 , 
qui est une des trois parties égales de l’intervalle l n , ne 
contient pas x n+1 , etc. 

5 - Nous sommes donc en présence d’une suite 
infinie d’intervalles fermés /., , / 2 , ..., / n+1 ,... emboîtés les 
uns dans les autres. D’après l’axiome de Cantor, il 
existe un nombre £qui appartient à tous les intervalles 
du système. En vertu de ce qu’on vient de démontrer, £ 
n’est égal ni à x 1f ni à x 2 , ..., ni à x n ,... Donc il existe un 
nombre réel £ qui ne fait pas partie de la suite 
dénombrable x^ x 2 , ..., x n , ... (c’est-à-dire qui n’est pas 
affecté d’un « numéro » appartenant à N*) et qui est 
compris dans l’intervalle 0 x *£ 1. Cela prouve que cet 
intervalle n’est pas dénombrable. 

• Composition de l’ensemble [0, 1]. Convenons 
d’appeler rationnels les nombres x 1t x 2 ,..., x n ,... dans 
l’ensemble A et dénombrables, et irrationnels les nom¬ 
bres tels que £, dont l’ensemble sera noté B. Nous 
pouvons écrire que l’ensemble des nombres [0, 1] est 
l’union des ensembles A et B, c’est-à-dire que : 

[0,1] = A U B. (9) 

Cette relation nous montre que les irrationnels 
compris entre 0 et 1 constituent un ensemble 
non-dénombrable. En effet, si B était dénombrable, 
l’ensemble [0, 1] serait la réunion de deux ensembles 
dénombrables A et B, donc serait lui-même dénombra¬ 
ble (voir p. 19, théorème n° 2) ; or nous avons montré 
que [0, 1] est non-dénombrable : donc l’ensemble B 
lui-même est non-dénombrable. Considérons mainte¬ 
nant cet ensemble B des irrationnels compris entre 0 
et 1. Il contient notamment des nombres qui sont 
racines d’équations de la forme 

ax 2 + bx + c = 0 , 
ax 3 + bx 2 + ex + d = 0 , 

etc., ou, d’une manière générale, de la forme P(x) = 0, 
P(x) désignant un polynôme en xà coefficients ration¬ 
nels (voir ci-après p. 72). Par exemple B contient le 
nombre V~2/2, qui est racine de l’équation du 
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2 e degré 2 x 2 — 1 = 0 ; etc. Or on démontre en 
algèbre : 

1 - que l’ensemble P A (x), P 2 (x), ... des polynô¬ 
mes en x est dénombrable ; 

2 - que tout polynôme P(x) de degré n possède 
n racines ; donc l’ensemble des n racines de tous les 
polynômes P(x) est un ensemble dénombrable que 
nous nommerons P'. 

Puisque B est non dénombrable, il ne peut se réduire 
à B' : il faut donc supposer que B est la réunion de 
l’ensemble dénombrable B ' et d’un ensemble B" non 
dénombrable : 

B = B' U B" . (10) 

Les réels qui peuvent être racines d’une équation 
P(x) = 0 sont dits algébriques (voir p. 31); donc 
l’ensemble B des irrationnels compris entre 0 et 1 
contient d’une part des nombres algébriques (ensem¬ 
ble B') et d’autre part des nombres appartenant à 
l’ensemble non dénombrable B" et qui sont non 
algébriques (c’est-à-dire qui ne sont pas les racines 
d’aucune équation de la forme P(x) = 0). Ces nom¬ 
bres ont été nommés transcendants. 

• Comparaisons. Un ensemble non dénombra¬ 
ble est plus étendu qu’un ensemble dénombrable 
puisqu’il contient : 

1 - tous les éléments auxquels on peut associer 
un entier naturel ; 

2 - d’autres éléments. 

Donc il y a beaucoup plus de nombres irrationnels 
que de nombres rationnels, et, parmi les irrationnels, il 
y a beaucoup plus de nombres transcendants que de 
nombres algébriques. 

D’autre part, tout ensemble équipotent à l’intervalle 
[0, 1] est appelé ensemble ayant la puissance du 
continu. L’ensemble des réels — c’est-à-dire l’ensem¬ 
ble des points de la droite numérique — oo<x<+o° 
est équipotent à l’intervalle [0,1]: il a donc la puis¬ 
sance du continu. 

Le corps C des nombres complexes. 

Construction du corps C des complexes. 

Considérons l’ensemble, R 2 , des couples ordonnés 
(a, b) de deux nombres réels ; nous savons déjà que 
cet ensemble est un espace vectoriel à deux dimen¬ 
sions. Cet ensemble, tel qu’il a été présenté p. 48, n’a 
pas la structure de corps, puisque nous n’y avons 
défini qu’une seule opération interne, l’addition de 
deux vecteurs ; la seconde opération (homothétie) 
n’est pas une opération interne, mais une opération 
externe. Que manque-t-il à l’espace U 2 pour qu’il ait 
une structure de corps? Très peu de chose en vérité : 
il faut définir une nouvelle loi de composition interne, 
que nous baptiserons multiplication. IR 2 étant alors 
doté de deux opérations internes, l’addition (définie 
dans le cadre de la structure d’espace vectoriel) et la 


multiplication (à définir), nous nous assurerons que les 
opérations inverses sont toujours possibles, nous 
préciserons la nature de l’élément neutre multiplicatif 
et notre espace vectoriel aura une structure de corps. 
Nous l’appellerons le corps des complexes et nous le 
noterons par la lettre €. 

Nous demandons maintenant à notre lecteur, s’il est 
profane en mathématiques, de s’armer de courage. Il 
nous aurait été possible de lui présenter le corps des 
complexes en partant de considérations géométri¬ 
ques ; cela lui aurait soulagé l’imagination. Mais, en 
réalité, il est peu rigoureux de procéder ainsi en 
mathématiques : il faut commencer par une définition 
très générale, abstraite, et passer ensuite seulement à 
la représentation géométrique. Donc, pas de figures, 
pas de schémas, pas d’expériences dans ce paragra¬ 
phe : place au raisonnement abstrait, qui n’est difficile 
qu’en apparence, car, en définitive, il ne s’agit que de 
règles de multiplication. 

• Premier temps : simplifions le problème. 
Nous avons dit p. 49 qu’on pouvait choisir, dans un 
ensemble de vecteurs, deux vecteurs (dans le cadre 
d’un espace à deux dimensions) à partir desquels on 
pouvait engendrer tous les autres, ces deux vecteurs 
formant une base pour l’ensemble considéré. Choisis¬ 
sons comme base les deux vecteurs : (1, 0) et (0, 1). 
Pour simplifier l’écriture, désignons le premier de ces 
vecteurs par e et le second par i. Un vecteur 
quelconque de l’espace R 2 , OM = (a, b), s’écrit : 

OM = (a, b) = ae+bi , (1) 

a et b étant des nombres réels. 

• Deuxième temps : définition de l’égalité de 
deux vecteurs dans IR 2 . Si (a, b) = (a', b'), cela revient 
à écrire : 

ae + bi = a' e + b' i , (2) 

c’est-à-dire : 

a = a' et b = b'. (3) 

• Troisième temps : définition de l’addition 
dans R 2 . La somme de deux éléments de R 2 se fait 
selon la méthode générale de l’addition des vecteurs : 

(a, b) + (a', b') = (a + a', b + b') ; (4) 

donc : 

(ae + bi) + (a' e + b’i) = (a + a') e + (b + b’)i . (5) 

• Quatrième temps : définition du produit dans 
le corps C. Voici maintenant l’opération qui, ajoutée à 
la précédente, confère à l’ensemble IR 2 la structure de 
corps, à savoir : la multiplication de deux éléments 
(a, b) et (a', b’) de cet ensemble. 

Comme les vecteurs e et / constituent la base de 
l’espace vectoriel étudié, il faut que nous établissions 
une table de multiplication pour ces deux éléments ; le 
reste ne sera qu’une question de calcul. Établissons 
donc arbitrairement (c’est un arbitraire très relatif, car 
il est motivé par notre intention de définir les nombres 


Les bornes kilométriques des autoroutes indiquent, de kilomètre en kilomètre, l’abscisse curviligne 
(= mesurée sur une ligne courbe) du point où est plantée la borne. 
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complexes !) la table de multiplication suivante : 

Table des e Table des / 


e x e = e, 
e x / = / , 


# x e = #, 

/ x / = - e , 


qu’on peut aussi écrire sous la forme suivante : 


Opération 

« x » 

e 

/ 

e 

e 

/ 

i 

i 

-e 


On constate, en lisant ce tableau, que l’opération est 
commutative (e x / = / x e) et associative, puisque (la 
vérification est immédiate) : 

e x (/ x e) = (e x /) x e . (6) 

D’autre part, rien ne nous interdit d’imposer à cette 
loi d’être distributive par rapport à l’addition des réels 
et d’être compatible par rapport à cette loi. 

Une fois toutes ces règles établies, l’ensemble IR 2 , 
muni des deux opérations considérées, que nous 
appellerons addition des vecteurs et multiplication des 
vecteurs , possède la structure de corps. 

Cela posé, pour multiplier le vecteur 
(a, b) = ae + bi par le vecteur (a', b') = a'e + b'i , 
on appliquera les règles du calcul algébrique élémen¬ 
taire : 

(a, b) x (a' b') = (ae + bi) (a e + b’/) 

= aa' ee + bb'#7 + ab' ei + ba' ei . ' ' 

La table de multiplication précédente donne ee = e, 
// = - e, ei = ie = /, donc (7) s’écrit : 

(a, b) x (a' b') = aa'e - bb' e + abi + ba'/ (8) 

soit, en groupant les termes en e et en i : 

(a, b) x (a', b') = (aa' - bb') e + (ab' + ba')#‘ . (9) 


• Cinquième temps : propriétés du produit II 
est facile de vérifier que le produit de deux vecteurs 
(a, b) et (a', b') quelconques, effectué selon les règles 
ci-dessus, possède les propriétés suivantes : 

— il est commutatif (propriété qui découle de la 
commutativité du produit des deux vecteurs de la 
base); 

— il est associatif ; considérons en effet le 
produit (a, b) (a', b') (a", b") ; pour simplifier l’écriture, 
comme il n’y a aucune confusion possible, nous avons 
abandonné le signe « x » ; il s’écrit : 

(ae + bi) (a'e + b'i) (a"e + b"#). (10) 

Quelle que soit la marche de nos opérations, nous 
serons amenés dans tous les cas à former le produit 
d’un élément de chaque facteur par tous les autres. 
Chacun de ces produits comprendra une partie réelle 
et une partie vectorielle. La partie vectorielle sera 
toujours composée des vecteurs e et /, et de ces 
vecteurs seulement ; or nous savons que, pour les 
deux vecteurs de la base, le produit est associatif. 
D’autre part, nous savons aussi que, pour des nombres 
réels, le produit est associatif. Par conséquent, la 
multiplication de deux vecteurs dans IR 2 est associa¬ 
tive. 

— La multiplication admet pour élément neutre 
le vecteur e ; on le constate immédiatement en effec¬ 
tuant le produit : 

e (a, b) = e(ae+ bi) ; (11) 

on obtient en effet : 


e (ae + bi) = ae x e + bi x e = ae + bi (12) 


(puisque e x e = e et / x e = /). 

— Il existe une opération inverse pour la multi¬ 
plication. Le raisonnement est ici un peu plus compli¬ 
qué (c’est-à-dire un peu plus long), mais il n’est pas 
plus difficile ; tout se ramène, finalement, à l’applica¬ 
tion de règles de calcul connues et à la connaissance 
de la table de multiplication pour les e et les/. 

Soit (a, b) un élément de IR 2 ; nous supposerons que 
a et b ne sont pas simultanément égayx à 0. 

On cherche l’élément (a', b') tel que : 


(ae + bi) (a'e + b'i) = 

(aa' - bb') e + (ab' + ba')i 

d’où le système : 

aa' - bb' = 1 , ab' + ba' = 0 


qui admet la seule solution : 


a ' = 


a 

a 2 + b 2 ’ 


b' = 


- b 

a 2 + b 2 


e, (13) 

(14) 

(15) 


(puisque a et b ne sont pas tous deux nuis), d’où : 

a b 


(ae + bi) 1 = 


a + b £ 


a + b 


;/ 


(16) 


En résumé, les éléments (a, b) autres que (0,0) 
forment un groupe commutatif pour la multiplication. 

L'aboutissement. 

L’ensemble IR 2 , dont les éléments sont de la forme 
(a, b), muni de l’addition et de la multiplication, est un 
corps. On l’appelle le corps des nombres complexes, 
C. 

• Une représentation graphique simple. Tra¬ 
çons deux axes de coordonnées, Ox et Oy, rectangu¬ 
laires. Tout vecteur (a, b) a pour image un vecteur 
géométrique OM de composantes a et b ; a s’appelle 
souvent l’abscisse du point A4 et b l’ordonnée de ce 
point dans le système d’axes considéré. Le point A4 
sera l’image du nombre complexe (a, b) = ae+ bi. 


b 

'i 

, y 

M 

V' i r . 

A (-3,0) 0 

a x 


Le point A4, de coordonnées (a, b) est V image 
du nombre complexe z=a+bi; z est /’affixe du 
point A4. 


• Correspondance avec l’ensemble, IR, des 
réels. Un élément de (R, c’est-à-dire un nombre réel, se 
note a. Pour en donner une image, dans le système 
précédent, nous n’avons pas besoin de deux axes de 
coordonnées ; l’axe Ox suffit : nous dirons que tous 
ses points représentent des réels et que, inversement, à 
tout réel correspond un des points de Ox. Le nombre 
- 3, par exemple, se trouve représenté par le point A 
situé à 3 unités à gauche de l’origine O (voir figure 
ci-dessus). Considérons maintenant le complexe 
(- 3, 0). Son image étant A, elle se confond avec celle 
du réel - 3. Sans entrer dans des considérations 
axiomatiques difficiles, on voit que tout réel a se 
confond avec tout complexe (a, 0) et inversement. On 
exprime cela en disant que le sous-corps de C 
composé des éléments (a, 0) est isomorphe à l’ensem¬ 
ble IR. 

• Convention supplémentaire. On peut intro¬ 
duire une convention de notation nouvelle. Le réel a 
possède la même image que le complexe 
(a, 0) = (a, e) ; convenons d’écrire : 

a = ae, (17) 

ce qui revient à poser que le vecteur e est le complexe 
(1,0), autrement dit qu’il est assimilable à 1. Avec cette 
convention, l’élément / 7 =/ 2 = — e se note - 1. 

Soit alors un complexe (a, b) = ae + bi. Il comprend 
deux parties : 

— ae peut être noté a, grâce à la convention 
précédente : c’est ce qu’on appelle sa partie réelle. 

— Dans la deuxième partie figure le complexe i, 
tel que /■/ = - e = (— 1,0). / est un vecteur (0,1). Donc 
b/= b(0,1). Si l’on a convenu que Ox est l’image de 
l’ensemble IR, il est évident que l’image de b(0,1), 
vecteur homothétique du vecteur /, ne correspond pas 
à un élément réel, puisque cette image est sur l’axe Oy. 
L’élément bi est appelé un élément imaginaire et b est 
la partie imaginaire de (a, b). 

Finalement un complexe (a, b), avec toutes ces 
conventions, sera noté : 

z = a + bi (18) 

(attention : z ne désigne pas un réel). Il n’est pas 
gênant d’écrire i et non pas / (l’italique grasse / 
rappelait que / est un vecteur), à la condition de 
convenir que la lettre i ne représentera jamais un 
nombre réel. 



Abraham de Moivre (1667-1754) : son nom est lié 
à la représentation trigonométrique des nombres 
complexes (formule de Moivre), mais aussi à la 
théorie des probabilités, dont il fut l’un des initia¬ 
teurs. 


• En résumé : 

— On appelle nombre complexe un être mathé¬ 
matique désigné par la lettre z telle que : 

z = a + bi, (19) 

les nombres a et b étant des réels, i étant non pas un 
nombre, mais un symbole conventionnel tel que 
i x i = i 2 = - 1 ; a s’appelle la partie réelle du nombre 
complexe, b la partie imaginaire. Un nombre dans 
lequel a = 0 se réduit à z = bi ; il est appelé nombre 
imaginaire pur ; un nombre dans lequel b = 0 se réduit 
à sa partie réelle ; c’est un nombre réel. Le nombre 
z= a— bi est dit nombre complexe conjugué de 
z = a 4- bi ; on a zz = a 2 + b 2 . 

— Les règles de calcul sont celles du calcul 
algébrique ordinaire, avec la convention i 2 = -1. 


Égalité 

z = z' 

a = a', b = b' 

Addition 

Z + z' 

(a + a') + (b + b') i 
= A + B\ 

Multiplication 

zz' 

(aa ' - bb') + (ab' + ba ) i 
= A + B\ 

Division 

z : z' = zz' 1 

z aa' + bb' . ba' - ab . 
z a + b a + b 


Représentation trigonométrique des nombres 
complexes. 

• Image d’un nombre complexe. Rapportons 
tous les points A4 d’un plan à deux axes de coordon¬ 
nées Oxet Oy. Convenons de faire correspondre à tout 
point A4 de coordonnées a et b un nombre complexe 
z= a + bi ; inversement, à tout nombre z= a+ bi cor¬ 
respondra un point A4 de coordonnées a et b. A4 est 
appelé l ’image du nombre complexe z, et zest Yaffixe 
du point A4. 

• Module et argument. Les relations élémen¬ 
taires de trigonométire (voir p. 148) et les propriétés 
du triangle rectangle permettent d’écrire, en appelant 
g (lettre grecque « rô ») la grandeur géométrique du 
vecteur OM, et 6 (lettre grecque « thêta ») l’angle 
(mesuré en radians) de l’axe Ox avec le vecteur OM : 


a = p cos e, b = p sin 6 , (20) 


cos 0 = - 


p = Va 2 + b 2 , 

a 


Va 2 + b 2 


sin 6 = - 


Va 2 + b 2 


( 21 ) 

( 22 ) 
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P s’appelle le module de z, il est égal à Vzz; 6 est 
Vargument du nombre complexe z. On écrit : 

p = I z | et 6 = arg z . (23) 

Ainsi, le nombre z = a + b\ peut s’écrire sous la 
forme trigonométrique 

z = p cos 6 + \p sin 6 = p{ cos 0 + i sin 0 ). (24) 

Voir p. 140 la récapitulation des règles de calcul sur 
les complexes. 


y i 


M(a, b) image de z = 

i 

i 

b 

\ 

\ 

\ 

\ 

P 

V 

0 

a 



Représentation trigonométrique d’un nombre 
complexe. Le plan défini par les axes Ox et Oy est 
souvent appelé « plan d’Argand-Cauchy ». 


Image de la somme et du produit de deux nombres 
complexes. 

• Observations préliminaires. Soit un vecteur 
OM quelconque dans un plan. Nous pouvons le consi¬ 
dérer comme le « signe » d’un déplacement qui ferait 
passer du point O au point M et qu’on appelle une 
translation. Tout point P du plan qui subit la transla¬ 
tion OM est déplacé en un point P' tel que le 
vecteur PP' soit parallèle au vecteur OM, de même 
sens que celui-ci et égal en grandeur. On dit aussi que 
le vecteur OM est un opérateur de translation, ou qu’il 
opère une translation. 

Supposons qu’on fasse passer par O un axe arbi¬ 
traire Ox sur lequel on a choisi une unité de longueur, 
et désignons par OU = t/un vecteur d’origine O, porté 
par Ox, dans le sens de Ox et de grandeur égale à 
l’unité. Appelons p le module du vecteur OM. On passe 
de U à M par une double opération : 

1 - en faisant effectuer au vecteur OU une rota¬ 
tion de centre O et d’angle 0 dans le sens indiqué sur 
la figure ci-dessous, ce qui l’applique en OU' sur OM ; 

2 - en multipliant le vecteur OU', dont la gran¬ 
deur est égale à 1, par le nombre p qui mesure la 
grandeur géométrique du vecteur OM. Nous avons dit 
p. 48 que cette opération s’appelle une homothétie de 
rapport g. 

Les deux opérations (rotation puis homothétie) for¬ 
ment ce qu’on appelle en géométrie une similitude, 
caractérisée par son centre O, l’angle 0 et le rapport p. 
Ainsi le vecteur OM peut-il être appelé Vopérateur 
d’une similitude (O, 0, p) sur le vecteur u. 



• Image d’une somme. Soit z un complexe, dont Q 
l’image est M ; le vecteur OM associé à z est un *2 
opérateur de translation qui fait passer du point O au ^ 
point M. Ajouter z' a z c’est faire intervenir un deu- J 
xième vecteur OM', c’est-à-dire opérer sur le point M £ 


REPRÉSENTATION GÉOMÉTRIQUE DES NOMBRES COMPLEXES 


une translation définie par OM' (nous appellerons cela 
une z'-translation). On voit sur la figure ci-dessous que 
le point M est ainsi transporté en A, tel que : 
OA = OM + OM' = diagonale du parallélogramme 
construit sur OM et OM'. Il est facile de vérifier que 
l’on a, algébriquement : 

abscisse de A = a + a’, 
ordonnée de A = b + b' ; 

donc : A est l’image de z + z' = (a 4- a') + (b + b') i. 

Le résultat final ne dépend pas de l’ordre dans lequel 
on fait les translations ; on passe en effet de O à A soit 
par la translation OM suivie de la translation 
MA = OM', soit par la translation OM' suivie de la 
translation M' A = OM. 


— Le produit z' z. De même, multiplier z' par z, 
c’est appliquer au point M', image de z', la z-simili- 
tude. Remarquons que l’opération est commutative : 
multiplier z par z', c’est appliquer au point M la 
z'-similitude. Dans les deux cas, on obtient le même 
point, B, image de zz'. 

En utilisant la représentation trigonométrique des 
nombres complexes, on montre aisément que le 
produit zz' a pour module pp' et pour argument 0 + 0'. 
Donc la construction de l’image, B, du produit zz' est 
aisée (figure ci-dessous) : 

1° - on trace l’axe Ou qui fait avec Ox un angle 
0 + 0 ' ; 

2° - on porte sur cette droite à partir de O, la 
grandeur OB = pp' (6 = 3x2 dans le cas de la figure). 


y i 

/abscisse : a + a' 


... A | ordonnée : b + b’ 

M (image de - - W>7 ' 

> - / (image de z + z') 


^ M (image de z) 

0 



La somme de deux nombres complexes est une 
composition de translations. 


• Image d’un produit. 

— Le produit 1 x z = z. Soient le complexe 
z = a + b i et le nombre 1. Ces deux nombres ont 
respectivement pour image le vecteur OMet le vecteur 
OU portés par l’axe Ox. Si l’on considère OM comme 
un opérateur de similitude, appliquer cette opération 
au vecteur OU, c’est faire la similitude (0, 0, p), c’est-à- 
dire passer du point U au point M, ou du nombre 1 au 
nombre 1 x z = z. Multiplier 1 par z, c’est donc appli¬ 
quer au point U une z-similitude. 



Les nombres complexes z et z' , d’images M et M', ont 
pour produit un nombre complexe, d’image B. 


• Signification géométrique du symbole i. Le 
vecteur / (0,1) est l’opérateur d’une rotation de cen¬ 
tre O et d’angle tt/ 2. Si l’on applique la i-similitude 
(= rotation) au vecteur OU (1,0), on obtient le vec¬ 
teur / (porté par Oy), ce qui s’écrit algébriquement 
1 x i = i. Si l’on applique deux fois la i-similitude au 
vecteur OU on obtient le vecteur - OU, d’où 
1 x i x i = i 2 = - 1. 


Quelque chose d’aussi concret, d’aussi « expérimental » qu’un courant électrique alternatif peut être 
représenté à l’aide de la notion, en apparence très abstraite, de nombre complexe. 
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L'ALGÈBRE LINÉAIRE. 


respectant la même convention : 


Les déterminants. 


De quoi s'agit-il? 


L'algèbre linéaire élémentaire. 


Tous les collégiens ont appris à résoudre les équa¬ 
tions du premier degré à une inconnue, de la forme 
ax + b = 0 , et des systèmes d’équations du premier 
degré à deux inconnues. On leur a aussi enseigné que 
la fonction y = ax + b était représentée graphiquement 
par une ligne droite. De sorte que le terme « ligne >> 
(droite) et l’expression « premier degré » sont devenus 
synonymes en mathématiques : l’algèbre qui étudie 
des combinaisons du premier degré — c’est-à-dire des 
combinaisons où n’interviennent pas l’élévation des 
nombres sur lesquels on calcule à une puissance ou le 
produit de ces nombres entre eux — est appelée 
algèbre linéaire. 

Lorsque l’algèbre était limitée à la théorie des équa¬ 
tions, c’est-à-dire, en gros, jusqu’aux environs de 
1830-1840, le « premier degré » était un chapitre 
mineur de cette branche des mathématiques. Un algé- 
briste, vers 1800, c’était un spécialiste des équations 
du n-ième degré et des problèmes très variés qu’elles 
posaient, de sorte que les travaux de Cramer (1750) sur 
les systèmes de n équations du premier degré à n 
inconnues n’ont pas engendré, sur le champ, de 
théorie générale. Donnons un exemple simple de la 
méthode de Cramer. Soit à résoudre le système de 
deux équations à deux inconnues : 

f ax+by = c ; (1) 

j a'x + b'y = c'. v 

Dans ce système, x et y sont les inconnues et a, b, c, 
a', b', c' des coefficients supposés connus. N’importe 
quel collégien sait (en principe) qu’il faut procéder de 
la manière suivante pour résoudre cette équation. 

1 - On multiplie les deux membres de la deu¬ 
xième équation par b/b', avec l’intention d’éliminer 
l’inconnue y ; le système devient : 


ax+by = 
ba' , . 

~F^ x+by = 


c ; 
bc ' 
b' ' 


En effet 


b' yx — = by. 
b ' 


( 2 ) 


2 - On soustrait membre à membre les 
équations ( 2 ), pour éliminer y ; on obtient : 

ba ' . . bc' ... 

ax - — x + by - by = c - , (3) 


soit, après élimination des termes en y et réduction des 
deux membres : 


( ab ' - ba') x = cb' - bc' . (4) 

3 - De l’équation (4) on tire immédiatement : 


cb' - bc' 
ab' — ba' ’ 


(5) 


en supposant que ab'— ba'^ 0 . 

4 - En procédant de même pour éliminer les 
termes en x, c’est-à-dire en multipliant les deux mem¬ 
bres de la deuxième équation ( 1 ) par a/a', on parvien¬ 
drait au système équivalent : 


ax+by = c , 
ab ' __ ac' 
a’ a' 


ax +- 


( 6 ) 


Après soustraction membre à membre et réduction, 
on parviendrait à la solution : 


_ ac' - ca' 
y ~ ab' - ba' ' 


(7) 


Si le lecteur est perspicace, il a remarqué que les 
formules de résolution donnant x et y ont le même 
dénominateur : 


D = ab' - ba'. ( 8 ) 

Ce dénominateur est obtenu en faisant les « produits 
en croix >> des coefficients des inconnues, ce qu’on 
peut écrire ainsi : 

a b 

ab' - ba' = (9) 

a' b' 


et en adoptant la convention de signes suivante : le 
produit de deux coefficients est positif quand on se 
dirige de la première colonne à la seconde (ab') et 
négatif dans le cas contraire (ba'). 

D’autre part on remarque que les numérateurs des 
fractions (5) et (7) sont aussi des « produits en croix » 


cb' — bc' — X ; (10) 

c' b' 

ac'- ca'= X ^ ^ 

a' c' 

On observe en outre que le produit en croix (10) est 
obtenu à partir de (9) en remplaçant les coefficients a 
et a’ de l’inconnue x par le deuxième membre des 
équations à résoudre, à savoir respectivement par c et 
c' ; de même (11 ) est obtenu en remplaçant dans (9) les 
termes b et b’ par respectivement c et c'. 

Ajoutons enfin que si D = ab' - ba' ^ 0, le 
système ( 1 ) admet une solution et une seule (les deux 
valeurs de x et de y trouvées) ; si D = 0, le système 
possède soit une infinité de solutions (il est dit indéter¬ 
miné), soit zéro solution (il est dit impossible ou 
incompatible). 

Le produit en croix ab' - ba' est donc doublement 
utile : 

1 - il permet de dire si le système a ou n’a pas de 
solution ; 

2 - il permet de calculer les racines du système. 

On le nomme un déterminant et on l’écrit à l’aide de 

deux barres verticales : 


Définition et notation. 

La notion de déterminant, soupçonnée par Leibniz, a 
été mise au point par Cramer (1750), Bezout (1764), 
Vandermonde (1772), Laplace (1772), Lagrange (1773), 
mais la théorie générale de cet algorithme n’a été faite 
qu’au XIX e siècle : Gauss crée le terme « déterminant » 
en 1801, Binet, Jacobi et Cauchy précisent la théorie et 
Cayley introduit la notation moderne en 1841. 

• Définition. Un déterminant est une expression 
algébrique d’un type très particulier, associée à un 
tableau carré de nombres (ou d’êtres mathématiques 
susceptibles d’être traités comme des nombres). Les 
nombres en question sont les éléments du détermi¬ 
nant ; le tableau carré est appelé une matrice (voir 
p. 60). En général, une matrice est notée à l’aide de 
crochets ou de parenthèses, et un déterminant à l’aide 
de barres verticales. Ainsi les coefficients a, b, a', b' 
des inconnues du système ( 1 ) ci-dessus peuvent être 
présentés sous la forme d’une matrice des coefficients 
notée : 



Le déterminant de cette matrice s’écrit : 


D = 


a 
a ' 


b | 
b'\~ 


( 12 ) 


De la théorie des déterminants à l'algèbre linéaire 
moderne. 

Cramer a montré qu’on pouvait résoudre tout sys¬ 
tème de n équations linéaires à n inconnues à l’aide de 
tableaux analogues à ( 12 ), mais évidemment plus 
compliqués. Il est donc à l’origine de la théorie des 
déterminants (voir ci-dessous). Vers 1840-1850, de 
nombreux mathématiciens ont eu recours à cette 
méthode de calcul, en apparence un peu lourde, pour 
résoudre les systèmes linéaires rencontrés en Ana¬ 
lyse (dans l’étude de certaines classes d’équations 
différentielles, d’équations aux dérivées partielles), et 
en géométrie projective (voir p. 77). On assiste donc à 
un perfectionnement de la méthode (H. Wronski, 
J.P. Binet, Jacobi, Hesse), puis à un élargissement du 
concept de déterminant avec la théorie des matrices 
(Hamilton, Cayley, Sylvester, entre 1843 et 1858). 

A peu près à la même époque, deux autres théories 
linéaires se sont développées, tant pour les besoins 
propres de l’algèbre et de la théorie des nombres que 
pour ceux de l’analyse et de la géométrie analytique et 
algébrique : la théorie des formes algébriques et celle 
des invariants. Cette dernière a eu un succès et une 
fécondité considérable, comparable à celle de la théo¬ 
rie des groupes. Le concept d’invariant a été perçu par 
Lagrange, Gauss, Cauchy, Jacobi, etc., mais c’est 
George Boole qui l’a explicité le premier (1841). 
L’application de la théorie des invariants à l’algèbre 
(Cayley, Sylvester) et à la géométrie analytique (Hesse, 
Steiner, Cayley), vers 1850-1860, a été suivie de l’élabo¬ 
ration d’une théorie synthétique des invariants (Aron- 
hold, 1863 ; Clebsch ; Gordan en 1868-1869) et de 
généralisations diverses (Kronecker, Christoffel, Klein, 
Study, Fuchs, Jordan, Hermite, Brioschi, Riemann, 
Lie). Une théorie générale englobant ces travaux dans 
des domaines différents a été proposée par Hilbert, en 
1890. 

Enfin nous avons vu, p. 46, que la structure d’es¬ 
pace vectoriel est découverte et axiomatisée dans la 
même période (deuxième moitié du XIX e siècle). Le 
calcul sur les quaternions (Hamilton, 1833-1843), les 
biquaternions (Clifford, 1872), les grandeurs hyper- 
complexes sont aussi des chapitres importants de 
l’algèbre linéaire qui débouchent sur le calcul vectoriel 
et le calcul tensoriel. La théorie des algèbres (associa¬ 
tives, non associatives, etc.) est inaugurée par les 
travaux de Grassmann (l’algèbre extérieure) et déve¬ 
loppée par l’École anglo-saxonne (B. Peirce, C.S. 
Peirce, Study, Wedderburn, etc.). 

Plan. 

Nous décrirons ici les principaux concepts de l’algè¬ 
bre linéaire (déterminant, matrice, vecteur, tenseur) et 
nous donnerons quelques informations sur les formes 
algébriques. Nous rencontrerons ultérieurement de 
multiples applications de l’algèbre linéaire dans des 
domaines très divers des mathématiques. 


• Remarques : 

1 - Il ne faut évidemment pas confondre matrice 

et déterminant. Une matrice est un tableau de nombres 
(ou d’autres éléments) rangés dans un certain ordre en 
lignes et en colonnes ; un déterminant est une fonction 
calculée selon des règles précises à partir de ces 
éléments. Ainsi la matrice (1) ci-dessus résume simple¬ 
ment le fait que a est le coefficient de x dans la 
première équation, b le coefficient de y dans la 

première équation, a' le coefficient de x dans la 

deuxième équation, etc. En revanche, le 

déterminant (2) est le nombre ab' - ba', que nous 

avons appelé « produit en croix » ci-contre. 

2 - Une matrice carrée et le déterminant qui lui 
est associé peuvent être caractérisés par leur nombre 
n de lignes et de colonnes. Ainsi le déterminant (2), qui 
comprend deux lignes et deux colonnes, est un déter¬ 
minant du deuxième ordre ; un déterminant à trois 
lignes et à trois colonnes est dit du troisième ordre ; un 
déterminant à n lignes et à n colonnes est dit du 
n-ième ordre. 

3 - Pour calculer la valeur D d’un déterminant 
I D I, on est amené à faire la somme algébrique des 
produits de ses éléments, affectés du signe + ou du 
signe - selon une règle qui sera précisée au paragra¬ 
phe b ci-après. Par exemple, le déterminant (2) se 
calcule en faisant les produits ab' et ba' : chaque 
produit de ( 2 ) (ou de (n) éléments) d’un déterminant du 
deuxième (ou n-ième) ordre est appelé un terme. 


• Notation. Les éléments d’un déterminant (ou 
d’une matrice) peuvent être notés à l’aide de lettres 
comme on l’a fait précédemment. Toutefois il est 
commode d’utiliser une notation à l’aide d’indices 
selon les règles suivantes. 

1 - Chaque élément est représenté par une lettre 
munie d’un double indice, qui est la même pour tous 
les éléments du déterminant : a par exemple. 

2 - Pour préciser de quel élément il s’agit, on 
adjoint à cette lettre deux indices : le premier indique 
la ligne de l’élément et le second sa colonne (le moyen 
mnémotechnique classique pour se souvenir de l’ordre 
des indices est : « licol »). Ainsi a u désigne l’élément 
qui occupe l’intersection de la première ligne et de la 
première colonne ; a 23 est l’élément qui se trouve à 
l’intersection de la deuxième ligne et de la troisième 
colonne ; etc. Un terme quelconque est noté a /y - : / 
désigne la i-ième ligne et j la j- ième colonne. 

3 - Avec cette règle, écrivons par exemple les 
déterminants IDI, I D'I et |D"|, respectivement du 
deuxième, du troisième et du quatrième ordre. On 
obtient : 


D = 


a n a 12 
a 21 a 22 



an 

a 12 

a 13 

II 

b 

a 21 

a 22 

a 23 


a 31 

a 32 

a 33 


an 

a 12 

a 13 

an 

a 21 

a 22 

a 23 

a 24 

a 31 

a 32 

a 33 

a 34 

a 4 i 

a 42 

a 43 

a 44 


(3) 

(4) 

(5) 
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LES DETERMINANTS 


L’étude des circuits 
électriques comprenant 
de nombreuses dériva¬ 
tions fait intervenir la 
résolution de systèmes 
de n équations à n 
inconnues qu’on ne peut 
traiter par les méthodes 
simples de l’algèbre élé¬ 
mentaire. L’emploi du 
calcul matriciel permet 
des solutions rapides et 
globales de ces pro¬ 
blèmes. 



Attention : a 32 se lit « a trois, deux » (et non « a 
trente-deux »). 

4 - Les éléments dont les deux indices siont 
égaux (a 11f a 22 , •••) occupent, comme on le voit, la 
diagonale du tableau carré. Ce sont les éléments 
diagonaux ; la diagonale correspondante est appelée 
diagonale principale. 

• A quoi servent les déterminants ? Tout 
d’abord, comme on l’a dit, à résoudre les systèmes 
linéaires de n équations à n inconnues. Contrairement 
à ce qu’on pourrait penser, ce problème est au centre 
de multiples préoccupations non seulement mathéma¬ 
tiques, mais aussi physiques et techniques. Par exem¬ 
ple lorsqu’on réalise un circuit électrique comportant 
50 dérivations, les intensités / 1f / 2 , ..., / 50 du courant qui 
passe dans chaque résistance R ,, R 2 , ..., R 50 de la 
dérivation sont généralement déterminées par les 
besoins du montage. Pour calculer les résistances R : , 
R 2 , ..., R 50 qu’il faut mettre dans le circuit, on est 
conduit à résoudre un système linéaire de 50 équations 
à 50 inconnues : les méthodes usuelles, apprises au 
collège, conduiraient à des mois et des mois de calcul ! 
La méthode des déterminants simplifie considérable¬ 
ment le problème (... à condition de posséder une 
méthode de calcul simple des déterminants). 

Comme nous le verrons par la suite, les matrices 
peuvent traduire des données mathématiques extrê¬ 
mement variées (transformations géométriques, don¬ 
nées topologiques, etc.) et le calcul de leurs détermi¬ 
nants est alors une opération essentielle : l’outil créé 
par Cramer pour résoudre les systèmes linéaires à n 
inconnues est devenu un instrument de calcul d’une 
portée très générale. 

Calcul des déterminants. 

• Par définition, la valeur d’un déterminant 
dans N se calcule de la manière suivante. 

1 - On fait tous les produits de n éléments a /y 
choisis de telle sorte que ces éléments n’appartiennent 
ni à la même ligne, ni à la même colonne, c’est-à-dire 
que les indices / et y de deux éléments quelconques du 
produit sont respectivement différents. Chaque produit 
est un terme. 

2 - Le signe d’un terme est +, si la permutation 
des seconds indices des éléments est paire ; ce signe 
est -, dans le cas contraire. La permutation fondamen¬ 
tale étant (1,2, 3, ..., n). 

3 - Le déterminant est la somme algébrique des 
termes ainsi définis. 

• Remarque : Nous avons défini la parité d’une 
permutation p. 35. Si nous prenons, par exemple, 
comme permutation fondamentale la permutation à 
5 éléments (1, 2, 3, 4, 5), et si nous opérons une 
transposition sur cette permutation (c’est-à-dire si 
nous changeons deux éléments de place) on obtient, 
par exemple : (1, 3, 2, 4, 5); c’est une permutation 
impaire, car elle est obtenue à l’aide d’un nombre 
impair de transpositions. En revanche, la transposition 
(1, 3, 2, 5, 4) est paire car elle a été obtenue par un 


nombre pair (2) de transpositions (le 3 à la place du 2, 
le 5 à la place du 4). 

• Exemples. 

— Déterminant d’ordre 2. C’est un déterminant 
de la forme (3) ci-dessus. 

1 - Les termes sont les produits à deux éléments 

a-j i a 22 et a^ 2 a 2 -|. 

2 - Le premier terme correspond à la permuta¬ 
tion (1,2) des seconds indices ; c’est la permutation 
fondamentale : donc le terme est affecté du signe +. Le 
deuxième terme correspond à la permutation (2,1), qui 
est impaire (une seule transposition) : il est donc 
affecté du signe 

3 - Donc : 

D = a n a 22 — a 12 a 21 . (6) 

— Déterminant d’ordre 3. C’est un déterminant 
de la forme (4) ci-dessus. 

1 - Les termes sont des produits de trois élé¬ 
ments, soit : 

a i1 a 22 a 33 ’ 
a i2 a 23 a 31 î 

„ a i3 a 21 a 32 î (J) 

3 11 a 23 a 32 i 

a i2 a 21 a 33 > 

a 13 a 22 a 31 . 

2 - Les permutations des seconds indices 
(1,2, 3), (2, 3,1) et (3,1,2) sont paires ; donc les trois 
premiers termes de (7) sont affectés du signe +. Les 
permutations (1,3, 2), (2,1,3) et (3, 2,1 ) sont impaires ; 
donc les trois autres termes de (7) sont affectés du 
signe —. 

3 - D’où la valeur du déterminant : 

D' = a n a 22 a 33 + a 12 a 23 a 31 + a 13 a 21 a 32 

— a u a 23 a 32 — a 12 a 21 a 33 — a 13 a 22 a 31 . (8) 

• Pour n > 3, le calcul devient laborieux. On 
peut le simplifier en remplaçant un déterminant d’ordre 
n par un déterminant équivalent d’ordre inférieur, en 
utilisant les propriétés fondamentales des détermi¬ 
nants énoncées ci-après. 

Propriétés des déterminants. 

• Définition. 

— Considérons un élément a /y quelconque dans 
un déterminant et supprimons la /'-ième ligne et la 
y'-ième colonne à l’intersection desquelles se trouve 
l’élément a /y . Il subsiste un tableau à n - 1 lignes et à 
n — 1 colonnes, c’est-à-dire un déterminant d’ordre 
n —1, qu’on appelle mineur du déterminant initial 
correspondant à a /y . Nous noterons ce déterminant M {j . 

— Le nombre A yy défini par : 

^/y = (-1) (/+y) Hy O) 

est appelé cofacteur de l’élément a, y . Si i + y est pair, 
Ajj = Mjj ; si / + y est impair, A i} = - M, r 

• Propriétés fondamentales des déterminants. 
Nous nous contenterons de les énoncer, sans les 
démontrer (la démonstration se trouve dans les traités 
d’algèbre courants). 


1 - La valeur d’un déterminant ne change pas 
quand on intervertit les lignes et les colonnes de même 
indice. Il résulte de cette propriété que tout ce qui est 
démontré pour les colonnes est valable pour les lignes, 
et réciproquement. 

2 - Lorsqu’on échange entre elles deux lignes 
(ou deux colonnes) le déterminant change de signe. 

3 - Un déterminant qui a deux lignes (ou deux 
colonnes) identiques est nul. 

4 - Si tous les éléments d’une ligne (ou d’une 
colonne) contiennent un facteur commun, on peut 
sortir cet élément du déterminant. Cette propriété 
s’écrit, dans le cas particulier où, par exemple, les 
termes d’une ligne ont en commun le facteur k : 


a n 

a 12 

a 13 


an 

a 12 

a 13 

ka 21 

ka 22 

ka 23 

= k 

a 21 

a 22 

a 23 

a 31 

a 32 

a 33 


a 31 

a 32 

a 33 


5 - Si tous les éléments d’une ligne (ou d’une 
colonne) sont nuis, le déterminant est nul. Cette pro¬ 
priété découle de la précédente : si tous les éléments 
d’une ligne, par exemple, sont égaux à 0, alors on se 
trouve dans le cas où k = 0, et l’équation (10) montre 
que le déterminant est nul. 

6 - Soit un déterminant I D I d’ordre n. Considé¬ 
rons les éléments de la /'-ième ligne, à savoir : a (1 , 
a )2 , ..., a in . Chacun de ces éléments possède un cofac¬ 
teur A n , A i2 , ..., A jn . On démontre que la valeur D du 
déterminant I D I est donnée par : 

D = A n a„ + A l2 a l2 + - + A in a in . (11) 

On dit qu’on a développé le déterminant par rapport 
aux éléments de sa /'-ième ligne. 

On peut de même développer un déterminant par 
rapport aux éléments de sa y'-ième colonne. Les élé¬ 
ments de cette colonne sont en effet a 1jt a 2y , ..., a nj ; ils 
admettent respectivement pour cofacteur A iy , A 2j ,..., 
A nj , de sorte que le déterminant a pour valeur : 

D = A v a„ + A 2 , a 2/ + - + A nj a„, . (12) 

7 - La valeur d’un déterminant ne change pas si 
l’on ajoute aux éléments d’une ligne (ou d’une 
colonne) les éléments correspondants d’une autre 
ligne (ou d’une autre colonne) après les avoir multi¬ 
pliés par un même nombre. Cette dernière propriété est 
intéressante, car elle permet de faire apparaître des 
éléments nuis dans les lignes et les colonnes d’un 
déterminant, c’est-à-dire de simplifier le calcul. 

On trouvera, p. 141, un exemple de calcul de 
déterminant utilisant les propriétés qui viennent d’être 
énoncées. 

Théorie des matrices. 

Généralités et définition. 

• Rappel historique. Le concept de matrice a 
été introduit en 1843 par A. Cayley ; le terme (en 
anglais : matrix) est dû à J. Sylvester (1850) qui 
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LES MATRICES 

l’employait pour décrire le tableau des coefficients 
d’un système d’équations du premier degré, à partir 
duquel on calcule le déterminant du système. L’idée de 
calculer « en bloc » sur ces tableaux, c’est-à-dire de 
considérer les matrices comme analogues à des nom¬ 
bres, est de W. R. Hamilton (1853), qui y voyait une 
généralisation des nombres complexes : c’est là d’ail¬ 
leurs le concept moderne, qui considère les matrices 
comme des nombres hypercomplexes. Toutefois, ce 
n’est qu’en 1858 que Cayley précisa les notions, les 
définitions et les règles du calcul matriciel. En 1904, 
Hilbert introduit les matrices d’ordre infini. 

La théorie des matrices a eu d’abord des applica¬ 
tions purement mathématiques (résolution des équa¬ 
tions algébriques, des équations différentielles) ; puis 
cet outil s’est révélé extraordinairement commode en 
astronomie, en mécanique, pour l’étude des réseaux 
électriques, en mécanique quantique, dans la théorie 
de la relativité, en physique nucléaire, dans les scien¬ 
ces humaines (statistiques, économie, etc.), en infor¬ 
matique, etc. De nos jours, le calcul matriciel est tout 
aussi indispensable à un ingénieur ou à un technicien 
que l’était jadis le calcul algébrique élémentaire. 

• Définition. Une matrice est un tableau rectan¬ 
gulaire à m lignes et n colonnes formé d’éléments 
notés a, 7 , l’indice / indiquant la ligne et l’indice j la 
colonne de l’élément considéré. On a évidemment 
/ = 1,2, 3,..., m et j — 1,2, 3,..., n. Si les éléments sont 
des nombres, la matrice est dite numérique (ce sera le 
cas des matrices dont nous parlerons ici ; leurs élé¬ 
ments seront choisis dans l’ensemble U des réels pour 
la commodité des exemples, mais ils pourraient tout 
aussi bien être choisis dans l’ensemble C des comple¬ 
xes ; (R et C sont, rappelons-le, des corps commutatifs). 

Le nombre m de lignes est la hauteur de la matrice, 
le nombre n de colonnes est sa longueur. On désigne 
ces deux dimensions par des expressions comme : 

une (m, n) matrice ; 
une m x n matrice ; 
une matrice m x n ; 
etc. 

Par convention, le premier nombre désigne toujours 
le nombre de lignes et le second le nombre de 
colonnes. Quand m = n, la matrice est dite carrée 
d’ordre n. Quand m = 1 (une seule ligne), c’est une 
matrice ligne ; quand n = 1 (une seule colonne), c’est 
une matrice colonne. 

• Notation. Pour noter une matrice, on utilise 
indifféremment les crochets, les parenthèses ou la 
double barre. On désigne en général une matrice par 
une lettre majuscule (A, B, ...) ; quand on risque de 
confondre ce symbole avec une autre grandeur, on 
écrit [A] ou || A || au lieu de A. Voici quelques exemples 
d’écriture d’une matrice à deux lignes et à trois 
colonnes, c’est-à-dire de ce que nous nommerons une 
(2, 3) matrice : 



— On utilise la notation indicielle expliquée 
p. 58 quand on désigne les éléments d’une matrice 
par des lettres. Une {m, n) matrice s’écrit alors : 


n colonnes 


3 11 

Si 12 

3 in 

1 m 
> lignes 


3 21 

3 22 

3 2n 

(2) 

_3m1 

3m 2 •• 

3 mn _ 

J 



— On peut aussi désigner une matrice par son 
terme général a ;y , mis entre crochets, on écrira alors : 

A = [a, y ]. (3) 

— Les éléments a u , a 22 , ..., sont les éléments 
diagonaux de la matrice, ils constituent sa diagonale 
principale quand il s’agit d’une matrice carrée. 


Propriétés fondamentales des matrices. 

• Matrices égales. Deux matrices A et B sont 
égales si, et seulement si, tous leurs éléments homolo¬ 
gues le sont. Cela implique que A et B ont les mêmes 
dimensions m x n. Si l’on appelle a /y et b /y les éléments 
généraux de ces deux matrices, on a, pour tout couple 
de valeurs (/, j) : a, y = b y. 


• Sous-matrices d’une matrice. En supprimant, 
dans une matrice A donnée, une ou plusieurs lignes, 
qne ou plusieurs colonnes ou à la fois une ou plusieurs 
lignes et une ou plusieurs colonnes, on obtient ce 
qu’on nomme des sous-matrices. Lorsque l’ensemble 
des sous-matrices permet de reconstituer la matrice 
initiale, on les nomme blocs. 

Exemple : soit la matrice : 


A = 



- 1 
1 

2 



(4) 


En supprimant la troisième ligne et les quatrième et 
cinquième colonnes de A, on obtient la sous-matrice : 



En supprimant la troisième ligne et les trois premières 
colonnes de A, on obtient la sous-matrice : 


C = 



0 

3 


( 6 ) 


En supprimant les deux premières lignes et les deux 
dernières colonnes de A, on obtient la sous-matrice 
ligne : 

D = [— 2 2 1]. (7) 

En supprimant les deux premières lignes et les trois 
premières colonnes de A, on obtient la sous-matrice 
ligne : 

E = [4 6]. (8) 

On peut donc écrire : 


B, C, D et E sont des blocs de la matrice A (la division 
proposée ici est bien entendu arbitraire). 

• Transposition. La transposée d’une (m, n) 
matrice A est une (n, m) matrice admettant comme 
première ligne la première colonne de A, comme 
deuxième ligne la deuxième colonne de A, etc., l’ordre 
des termes n’étant pas changé à l’intérieur de chaque 
ligne devenue colonne. On écrit la transposée de A 
sous la forme : *A ou A (lire : « transposée de A »). Par 
exemple : 



3 1 5 

2 7 1 


( 10 ) 


On a évidemment t ( t A) = A : la transposée d’une 
transposée redonne la matrice initiale. 

• Transposée d’une matrice carrée. Une matrice 
carrée A d’ordre m possède m lignes et m colonnes ; 
donc sa transposée Â est aussi carrée et d’ordre m : les 
deux matrices coïncident quant à leurs dimensions. 

• Rang d’une matrice. On appelle rang r d’une 
matrice le nombre le plus grand de colonnes linéaire¬ 
ment indépendantes (pour l’indépendance linéaire 
d’un ensemble de nombres, voir p. 49). Dans le cas où 
les éléments d’une matrice appartiennent à un même 
corps commutatif (c’est le cas pour les matrices 
numériques dont nous nous occupons ici), le rang 
d’une matrice est aussi égal au plus grand nombre de 
lignes linéairement indépendantes. 

• Définitions complémentaires. 

— Matrices opposées. Deux matrices, A et A', 
sont dites opposées lorsque tous les éléments de l’une 
sont les éléments de l’autre changés de signe ; on écrit 
alors: A'= — A, ou encore, en désignant par a y ÿ le 
terme général de la matrice a' : 


— Matrice symétrique : une matrice A est dite 
symétrique lorsqu’elle est égale à sa transposée ( A ; 
l’égalité A = *A indique que le terme général a /y de la 
matrice A est égal au terme général a r , de sa transpo¬ 
sée : a /y = a jr Soit par exemple la matrice A et sa 
transposée { A : 



On constate que A = ( A : donc A est une matrice 



Arthur Cayley (1821-1895) : cet avocat devenu 
mathématicien est à l’origine de la théorie des 
matrices et du calcul matriciel. Avec son contempo¬ 
rain, l’Irlandais Hamilton (1805-1865), il a été le chef 
de file de l’École des mathématiciens britanniques 
du XIX e siècle. 


symétrique : un élément tel que a 13 dans la matrice A 
est égal à l’élément a 31 de la matrice 'A 

— Matrice antisymétrique. Une matrice est 
appelée antisymétrique lorsqu’elle est l’opposé de sa 
transposée : A = - ‘ A. Une matrice antisymétrique est 
nécessairement carrée. Exemple : soit A et f A deux 
matrices dont l’une est la transposée de l’autre, par 
exemple : 


A = 




f A = 


0 -5 

5 0 


( 12 ) 


On constate que A = - A : donc A est antisymé¬ 
trique. 

— Matrice diagonale. Une matrice carrée dont 
tous les termes sont nuis sauf les termes diagonaux est 
une matrice diagonale. Exemple . 


"3 

0 

0" 

0 

5 

0 

_0 

0 

-1_ 


est une matrice carrée d’ordre 3 ; c’est une matrice 
diagonale. 

— Matrice de permutation. On appelle ainsi une 
matrice carrée telle que, dans chaque ligne et dans 
chaque colonne, tous les éléments sont nuis, à l’excep¬ 
tion d’un seul, égal à 1. 

— Matrice triangulaire. C’est une matrice carrée 
dont tous les éléments situés d’un même côté de la 
diagonale principale sont nuis. Exemple : 


4 = 


"4 

0 

_0 


2 

- 1 
0 



(14) 


A est une matrice carrée d’ordre 3 triangulaire. 

• Déterminant d’une matrice carrée. Le détermi¬ 
nant d’une matrice carrée est une fonction de ses 
éléments, calculée selon les règles énoncées p. 59 ; 
les éléments du déterminant sont les éléments de la 
matrice. Voir aussi à la même page la définition du 
mineur d’un élément a,y et du cofacteur Ay relatif à cet 
élément. 


Opérations sur les matrices. 

• Addition. La somme C = A + B de deux matri¬ 
ces de mêmes dimensions m x n est une matrice C, de 
dimensions m x n, et telle que chacun de ses éléments 
Cjj est la somme des éléments de même indice des 
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LE CALCUL MATRICIEL 
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Les mathématiques ne sont pas un jeu abstrait de l’esprit. Elles supposent, chez les plus grands créateurs, une puissance d’invention qui tient du lyrisme et, parfois, de 
l’illumination. C’est pourquoi il nous a semblé justifié de demander au grand peintre qu’est Georges Mathieu (né en 1921), créateur de / abstraction lyrique, mais aussi philosophe, 

admirateur de la Caractéristique universelle leibnizienne, de réaliser cet Hommage à la notion de matrice. 


matrices A et B : 

Ch = a ij + bij. (15) 

Par exemple : 

1 5 3 

- 1 0 8 



4 0 7 

1 1 1 


(16) 


• Multiplication par un scalaire A. Soit A un 
élément du corps K auquel appartiennent les éléments 
de la matrice A (corps des réels ou corps des comple¬ 
xes) ; la matrice \A est constituée d’éléments qui sont 
les produits Aa /y des éléments a, y de la matrice A. 
Exemple : 


1 

5 3~| 

-5 

-25 

-15] 

- 1 

0 8j 

5 

0 

-40] 


• Produit scalaire d’une matrice ligne par une 
matrice colonne. Considérons les deux matrices : 

A = [ai a 2 ... a i ,aj (18) 


£>r 

b 2 


B = 



(19) 


b n 


La première est une matrice ligne à n éléments et la 
seconde une matrice colonne à n éléments. On appelle 
produit scalaire de ces deux matrices le nombre p tel 
que : 

p = a, b, + a 2 b 2 -\— + a, b, + —i - a n b n , (20) 

ou, en employant le symbole X : 

p = £ a, b, . (21) 

Il faut bien noter que le produit scalaire p est un 
nombre appartenant au corps K sur lequel sont cons¬ 
truites les matrices (réelles ou complexes) objets du 
calcul : c’est une combinaison linéaire des éléments a, 
et b, des deux matrices proposées. 


Voici un exemple trivial du produit scalaire. Suppo¬ 
sons qu’une entreprise vende quatre types d’articles 
dont les prix unitaires respectifs sont 3, 5,10 et 25 F. Le 
catalogue des prix est une matrice ligne : 

A =[3 5 10 25]. (22) 

Imaginons qu’un client remplisse un bon de 
commande pour 250 articles du premier type, 
1 100 articles du second type, 200 articles du troisième 
type et 10 articles du quatrième type. Son bulletin de 
commande peut être considéré comme une matrice 
colonne : 


AB = C ; le second indique comment on calcule l’élé¬ 
ment Cjj du produit. 


p colonnes 



B = 


250 
1 110 
200 
10 


(23) 


La somme totale qu’il devra payer est le produit 
scalaire A . B, c’est-à-dire : 

A . B = 3 x 250 + 5 x 1 110 + 10 x 

200 + 25 x 10 = 8 550 F . (24) 

La facture peut être disposée de la sorte : 


3 

5 

10 

25 


250 
1 110 
200 
10 


= 8 550 F . (25) 


• Multiplication des matrices. Soit maintenant 
une (m, n) matrice A et une (n, p) matrice B. On 
notera que le nombre de colonnes n de la maJtrice A 
est égal au nombre de lignes de la matrice B. On peut 
construire une ( m , p) matrice C à m lignes et p colon¬ 
nes, telle qu’un élément quelconque c (/ de cette 
matrice soit le produit scalaire de la ligne / de la 
matrice A par la colonne j de la matrice B. Cette 
matrice est appelée produit matriciel de A par B : 

C = AB. (26) 

On dit aussi que A multiplie B à gauche, ou que B 
multiplie A à droite. Ou encore que A prémultiplie B et 
que S postmultiplie A. 

— Précisons cette définition par deux schémas : 
le premier donne les dimensions du produit matriciel 



Le produit matriciel C = AB. 

I - Dimensions du produit : la matrice C possède 
m lignes (comme la matrice A) et p colonnes (comme 
la matrice B). Le produit n’est possible que si le 
nombre de colonnes de la matrice A est égal au 
nombre de lignes de la matrice B : c’est la condition 

de dimensions du produit. 

II - Calcul de c„ : un élément c f , du produit C est le 
produit scalaire de la ligne i de la matrice A par la 

colonne j de la matrice B. 


— Exemple : Soit les deux matrices : 



1 2 


(27) 


(28) 
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LE CALCUL MATRICIEL 


La matrice A possède quatre colonnes, la matrice B 
quatre lignes, donc la condition de dimensions du 
produit est satisfaite et le produit AB est possible. Il 
aura pour dimensions 3x2 (c’est-à-dire 3 lignes et 
2 colonnes). On peut donc écrire C sous la forme : 


C = 


"Ch 
C 21 

_C 31 


■1 


(29) 


L’élément c u est le produit scalaire de la première 
ligne de A par la première colonne de B, soit : 


[12 - 34 ]. 


1 

3 

-5 

1 


= 1 +6 + 15 + 4 = 26. 


(30) 


De même c 12 est le produit scalaire de la ligne 1 de la 
matrice A par la colonne 2 de la matrice B : 


[1 2 


-3 4]. 


2 

1 

-3 

2 


= 2 + 2 + 9 + 8-21. 


(31) 


On calculerait de même les éléments c 21 , c 22 , c 31 et 
c 32 , et on trouverait finalement : 


C = 



21 “ 

-5 

6_ 


(32) 


Propriétés des opérations sur les matrices. 

• Addition. 

— Associativité et commutativité. En vertu des 
propriétés de l’addition sur les réels (ou sur les 
complexes), l’addition matricielle est une opération 
associative et commutative. 

— Élément neutre. En raison de la définition de 
la somme A + B, il est clair qu’une matrice dont tous 
les éléments sont nuis est un élément neutre pour 
l’addition. Par exemple : 


r 0 

0 

0 

+ 

an 

a 12 

a 13 n 

J- 

ai 2 

a 13 

L° 

0 

0 

a 21 

a 22 

a 23 J 

a 21 

a 22 

a 23 


(33) 


Et, de même : 


T a 11 

ai2 

3i3 1 H 

h r° 

0 

°1 = 

.r- 

a ^2 

a-\3 

|_ a 2 i 

322 

a 23 J 

L° 

0 

°J 

|_a 2 i 

a 22 

a 23 


(34) 

La matrice dont tous les éléments sont égaux à 0 est 
appelée matrice nulle et notée [0], ou 0 s’il n’y a pas 
d’ambiguïté. 

— Matrices opposées. Toute matrice A possède 
une opposée — A telle que A - A = [0]. 

Ces propriétés montrent que l’ensemble des (m, n) 
matrices a la structure d’un groupe commutatif additif 
(voir p. 40). La définition du produit par un scalaire 
munit en outre ce groupe d’une loi de composition 
externe sur le corps K (des réels ou des complexes) : 
l’ensemble des (m, n) matrices muni de l’addition et du 
produit par un scalaire est un espace vectoriel sur K 
(voir définition p. 47). 

• Multiplication. 

— Associativité et distributivité. La multiplica¬ 
tion des matrices est une opération associative et 
distributive par rapport à l’addition. On démontre 
aisément ces propriétés, qui s’écrivent, pour toutes 
matrices A, B, C respectant les conditions de dimen¬ 
sions du produit matriciel : 

(AB) C = A(BC) (associativité). (35) 

A(B+ C) = AB + AC (distributivité à droite). (36) 
(A + B) C = AC + BC (distributivité à gauche). (37) 

— Commutativité. Le produit matriciel n’est pas 
commutatif ; en général on a AB 7 ^ BA. Considérons en 
effet le produit matriciel AB, et appelons (a, a') les 
dimensions de A et (b, b ') celles de B. Le produit AB 
n’est possible que si la condition de dimensions est 
satisfaite, à savoir si : 

a' = b , (38) 

c’est-à-dire si les dimensions de B sont (a', b'). 

Soit maintenant le produit BA. Il n’est possible que si 
l’on a : 

nombre de colonnes de B = nombre de lignes de A 


Le calcul matriciel est 
une théorie mathémati¬ 
que très abstraite, élabo¬ 
rée par Sylvester et Cay- 
ley au milieu du XIX* siè¬ 
cle. Pendant longtemps, 
on a pu la considérer — 
chez les non-mathémati¬ 
ciens — comme un bril¬ 
lant jeu de l’esprit. Au 
XX e siècle, en revanche, 
on s’est aperçu que cet 
outil était d’une grande 
efficacité lorsqu’il s’agis¬ 
sait de calculer des 
réseaux électriques, de 
traduire les lois fonda¬ 
mentales de la physique 
quantique ou, plus pro¬ 
saïquement, de mettre en 
forme des problèmes de 
comptabilité (comme le 
montre la photographie 
ci-contre, où l’on voit un 
technicien étudier un 
problème d’exportation 
de produits industriels à 
l’aide d’une représenta¬ 
tion matricielle). 



c’est-à-dire si : 

b' = a. (39) 

Or le produit AB exige bien a' = b, mais non pas 
b' = a. Donc, en général, le produit BA n’est pas 
possible. Examinons maintenant le cas particulier où 
b' = a, qui permet de former le produit BA = C', et 
demandons-nous si C' = C. 

La question peut être examinée simplement en 
considérant les dimensions des produits C et C'. Pour 
cela écrivons les produits matriciels en indiquant sous 
les matrices leurs dimensions : 

A x B = C . 

(a, a') (b, b') (a, b') C4U) 


Ce produit exige que a' = b. D’autre part, si b' = a, 
on peut écrire : 


B x A = C' 
(b, b') (a, a') (b, a') 


(41) 


La matrice C' a pour dimensions (b, a'), soit, puis¬ 
que a' = b, (b, b) ; la matrice C a pour dimensions 
(a, b'), soit, puisque b' = a, (b', b'). Les deux matri¬ 
ces C et C' n’ont pas les mêmes dimensions, elles sont 
donc différentes. Donc : 

ABÏ BA . (42) 


• Élément neutre pour la multiplication. Cher¬ 
chons s’il existe un élément neutre pour la multiplica¬ 
tion, c’est-à-dire une matrice unité. Comme le produit 
matriciel n’est pas commutatif, il faut distinguer AB (A 
prémultiplie B) de BA (A postmultiplie B), et chercher 
une matrice unité / pour la prémultiplication et une 
matrice unité /' pour la postmultiplication. Si ces matri¬ 
ces existent, on doit avoir : 

IA = A ; AV = A . (43) 

Appelons m x n les dimensions de A. L’égalité 
IA = A impose les conditions suivantes : 

1 - Nombre de colonnes de / = nombre de 
lignes de A — m. 

2 - Nombre de lignes de / = nombre de lignes du 
produit = nombre de lignes de A = m. 

Autrement dit / est une matrice carrée d’ordre m, 
que nous noterons l m . 

3 - On peut démontrer que tous les éléments de 
cette matrice sont nuis, à l’exception des termes 
diagonaux qui sont égaux à 1 : 


/ m = 


1 

0 

0 


0 

1 

0 


0 “ 

0 


L 0 0 


(44) 


On montre de même que la matrice V est la matrice 
carrée d’ordre n, notée l n dont tous les éléments non 
diagonaux sont nuis, et dont les éléments diagonaux 
sont tous égaux à l’unité. 

— Matrices inverses. La définition du produit 
matriciel ne permet pas d’affirmer qu’une matrice A 
possède toujours une inverse A -1 telle que, par exem¬ 
ple, AA -1 = l m . L’inversion des matrices ne peut être 
envisagée qu’à la condition de considérer uniquement 
des matrices carrées d’un ordre n déterminé. 

— Diviseurs de 0. Deux matrices non nulles A et 
B peuvent avoir un produit nul, autrement dit on peut 
avoir : 

A / [0], B ï [0] et AB = [0]. (45) 

Les matrices A et B sont appelées des diviseurs de 0 
(voir définition p. 42). 

• Conclusion. L’ensemble des (m, n) matrices 
est un groupe pour l’addition, mais non pas pour la 
multiplication, puisque cette opération (loi de compo¬ 
sition interne) n’est pas toujours possible et exige que 
soit vérifiée la condition de dimensions ; l’ensemble 
des (m, n) matrices ne possède donc pas la structure 
d’anneau, définie p. 41. 


L'anneau des matrices carrées d'ordre n. 

• Structure. Les matrices carrées d’ordre n 
sont des matrices à n lignes et n colonnes. Leur 
ensemble peut être muni de deux lois de composition 
interne : l’addition et la multiplication, définies comme 
précédemment. Les propriétés de ces deux lois confè¬ 
rent à l’ensemble des matrices carrées d’ordre n la 
structure d’anneau. En effet : 

1 - l’addition de deux matrices est toujours pos¬ 
sible ; elle est associative et commutative ; 

2 - il existe un élément neutre pour l’addition, la 
matrice nulle [0] ; 

3 - toute matrice carrée A d’ordre n a une 
opposée - A telle que A — A = [0] ; 

4 - la multiplication de deux matrices carrées 
quelconques d’ordre n est toujours possible (la condi- 
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LES MATRICES CARREES D'ORDRE 


tion de dimensions est toujours vérifiée) ; elle est 
associative et distributive par rapport à l’addition, mais 
elle n’est pas commutative : en général, AB ^ BA ; 

5 - l’élément neutre pour la multiplication est la 
matrice diagonale dont les éléments diagonaux sont 
tous égaux à 1 ; on note cette matrice l n et l’on a : 

! n A — Al n = A . (46) 

L’existence de diviseurs de 0 (la relation AB = 0 
n’exige pas qu’un des facteurs soit nul) montre que 
l’anneau des matrices carrées d’ordre n n’est pas un 
anneau d’intégrité (voir p. 42). 

• Propriétés particulières. 

— Si AB = BA, on dit que les matrices commu¬ 
tent ; si AB — — BA, on dit qu’elles anticommutent. 

— Le déterminant du produit AB est égal au 
produit des déterminants de A et de B. 

— Le produit AAA... A de p matrices A se dési¬ 
gne par A p . 

— S’il existe une matrice B telle que AB = l n , B 
est dite inverse à droite de la matrice A ; s’il existe une 
matrice B' telle que B' A = l n , B' est dite inverse à 
gauche. On démontre que : 

1 - une matrice A ne saurait posséder deux 
inverses à droite (ou à gauche) distinctes ; 

2 - si B est inverse à droite, elle est aussi inverse 
à gauche de A. 

On peut donc écrire, par définition : 

B = A A . (47) 

— Une matrice est dite singulière (ou dégéné¬ 
rée) si son déterminant est nul ; sinon, elle est dite 
régulière (non dégénérée). Une matrice singulière n’a 
pas d’inverse. 

— A étant un scalaire appartenant au corps K 
sur lequel sont construites les matrices carrées consi¬ 
dérées, la matrice A - A l n est appelée matrice caracté¬ 
ristique en A de la matrice carrée A. Le polynôme P(A) 
égal au déterminant D de cette matrice est le poly¬ 
nôme caractéristique en A de la matrice. Par exemple 
la matrice carrée : 


A = 


3 

3 



(48) 


a pour matrice caractéristique en A la matrice : 



soit : 


A - A l n 


3- A 7 
3 - 1 - A 


(50) 


Le déterminant de cette matrice est : 

D = (3- A)(- 1 - A)-21 = A 2 -2 A -24 . (51) 

Le polynôme P(A) = A 2 - 2 A - 24 est le polynôme 
caractéristique en A de la matrice A. 

— Les valeurs propres d’une matrice carrée 
sont les racines de son polynôme caractéristique, 
c’est-à-dire les valeurs de A telles que la matrice 
A — A l n soit singulière (= non inversible). Dans l’exem¬ 
ple précédent, le polynôme : 

P(A) = A 2 — 2 A — 24 (52) 

admet les racines A., = — 4, A 2 = 6, qui sont les valeurs 
propres cherchées. 

— Deux matrices carrées A et B d’ordre n sont 
semblables si, et seulement si, il existe une matrice 
carrée inversible P d’ordre n pour laquelle B = PAP \ 
Une matrice semblable à une matrice diagonale est dite 
diagonalisable. 

• Inversion des matrices. Soit une matrice car¬ 
rée A d’ordre n, non singulière ; pour déterminer son 
inverse A~\ on procède comme suit : 

1 - On construit la matrice A* (lire : « A 

étoile »), appelée matrice adjointe de A, telle que 
l’élément soit le cofacteur de l’élément a (7 de la 
matrice A (voir la définition du cofacteur p. 59). 

2 - On calcule le déterminant Dde la matrice A. 

3 - On construit la matrice A~ A en divisant par D 
tous les éléments de A *. 

Voir un exemple de calcul p. 141. 


Quelques applications de la théorie 
des matrices. 


LE NOMBRE D'OR 


Depuis l’Antiquité clas¬ 
sique, mathématiciens, 
philosophes et artistes ont 
cru à l’existence d’un rap¬ 
port privilégié qui fut 
appelé nombre d’or parles 
artistes italiens de la 
Renaissance. Une tradi¬ 
tion considérait que le 
nombre d’or x devait être 
racine de l’équation : 

1 x 

X 1 + X 

soit 

r 1 + V5 
x 2 

= 1,618033... 

Cette notion du nombre 
d’or a aussi hanté l’imagi¬ 
nation des artistes moder¬ 
nes, comme Salvador Dali, 
dans le tableau intitulé 
Demi-tasse géante volan¬ 
te, avec annexe inex¬ 
plicable de cinq mètres de 
longueur (1932-1935) (tous 
les objets placés dans le 
tableau s’inscrivent dans 
des rectangles dont les 
cotés ont pour rapport le 
nombre d’or ; en partant 
de l’anse de la tasse, il est 
possible de développer 
une spirale logarithmique 
parfaite). Les architectes 
contemporains ont re¬ 
trouvé une notion voisine 
du nombre d’or, le modu- 
lor de Le Corbusier 
(ci-dessous la Chapelle de 
RonchampJ. 




Généralisation de la notion de nombre. 

• Nombres réels. Considérons la matrice carrée 
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LES FORMES ALGÉBRIQUES 


d’ordre 2 et la matrice unité : 

I = 


(1) 


Soit a un réel ; on peut l’écrire sous la forme : 


al 


Ta 0 

L 0 a _ 


(2) 


• Nombres complexes. Soit les matrices carrées 
d’ordre 2 notées [z] qui sont de la forme : 


[z] = 


a 

b 


- b 
a 


(3) 


a et b étant des réels. Il est facile de montrer, en 
appliquant les règles du calcul matriciel qui viennent 
d’être évoquées, que : 


[z] +[z'] = 


a -F a' - (b + b') 
b + b' a + a' 


(4) 


[z] [z'] = 


aa' - bb' - (ab ' + ba ') 
ab' + ba' aa' - bb' 


et que [z] -1 est toujours calculable et égal à : 
1 


.[z ]' 1 = 


a z + b' 


Posons : 


I = 


et J 


0 - 1 !- 
1 oj 


On montre facilement que : 


--[» ?]- 


(5) 


( 6 ) 


(7) 


( 8 ) 


et que [z] peut se mettre sous la forme : 

[z] = al + bJ . 


(9) 

Les matrices [z] constituent un ensemble ayant la 
structure de corps (voir p. 43) ; on les appelle nombres 
complexes. En posant par définition : 

[J] = i et [/] = 1 , (10) 

les nombres complexes [z] sont de la forme a + b i. 

• Matrices à éléments complexes. On calcule 

sur les matrices à éléments complexes comme sur les 
matrices à éléments réels, avec la convention supplé¬ 
mentaire i 2 = — 1. On retiendra les définitions sui¬ 
vantes : _ 

— La matrice conjuguée de A se note A ; elle 
s’obtient en remplaçant les éléments complexes z Vi de 
la matrice A par leurs conjugués respectifs (par exem¬ 
ple 1 - i par 1 + i, etc.). _ 

— La transposée de A est]a matrice associée de 
la matrice A ; on peut la noter *A ou A * (« A étoile »). 

— Si une matrice carrée vérifie la relation 
{ A = A, elle est dite hermitienne. 

Résolution des systèmes linéaires. 

• Système à deux inconnues. Soit le système 
linéaire : 


ax + by = c ; 
a' x -F b' y = c'. 


Posons : 


A = 


a b 
a' b' 


X = 




( 11 ) 


( 12 ) 


Le système (11 ) peut s’écrire matriciellement sous la 
forme : 

AX = C , (13) 

d’où l’on tire : 

X = A -1 C . (14) 

La résolution du système (11) revient à trouver 
l’inverse A 1 de la matrice A, appelée aussi matrice des 
coefficients. 

• Système à n inconnues. Utilisons la notation 
indicielle, et appelons x 1f x 2 , ..., x n les inconnues. Le 
système s’écrit : 


(15) 


*i + a 12 * 2 + •• 

■ + a 1n x n = b , ; 

x 1 ~F a 22 x 2 ~F 

■ + a 2 „ x„ = t> 2 

*1 + a n 2 X 2 + • 

a nn X n b n 


La matrice des coefficients est A = [a,,] ; celle des 
inconnues est X = [x,] (c’est une matrice colonne). Les 
seconds membres forment la matrice ligne B = [b,]. Le 
système (15) s’écrit matriciellement : 

AX = B (16) 

et il admet comme solution : 

X= A 1 E, (17) 

si A n’est pas singulière. Le problème se réduit donc à 
l’inversion de la matrice carrée A d’ordre n. 


Substitutions. 


Une matrice de substitutions est une matrice carrée 
dont chaque ligne et chaque colonne possède un 
élément et un seul égal à 1, tous les autres éléments 
étant nuis. 

Soit un ensemble ordonné (a, b, c, d) que nous 
pouvons considérer comme une matrice colonne à 
quatre lignes ou une matrice ligne à quatre colonnes : 


A 



ou A = [a b c d ]. 


(18) 


Définissons une substitution particulière par la 
matrice S telle que : 

"0 0 1 o“ 


S = 


1 

0 


0 0 0 
1 0 0 


(19) 


_0 0 0 1 


(S est une matrice carrée d’ordre 4). Le lecteur vérifiera 
aisément que l’on a : 



( 20 ) 


et : 

AS = [c b d a]. (21) 

Autrement dit la prémultiplication par S opère une 
substitution de lignes dans A, et la postmultiplication 
une substitution de colonnes. 


Transformations géométriques. 

Le lecteur se reportera à la page 98 où l’on a décrit 
matriciellement les symétries et les rotations dans le 
plan. 


Formes algébriques. 


Définition. 

On appelle forme algébrique un polynôme dont tous 
les termes sont de même degré par rapport aux 
variables. Un tel polynôme est dit aussi homogène. 
Selon leur degré on distingue des formes linéaires 
(premier degré), quadratiques (deuxième degré), cubi¬ 
ques (troisième degré), etc. La forme est dite binaire 
s’il y a deux variables, ternaire s’il y en a trois, etc. 

• Exemples. 

— Le polynôme ax 2 + by + c n’est pas une 
forme algébrique, puisque ses trois termes sont res¬ 
pectivement du second degré en x, du premier degré 
en y et de degré zéro en x et y ; ce n’est pas un 
polynôme homogène. 

— Le polynôme f = ax 2 + byz + cy 2 est une 
forme algébrique, puisque chaque terme est du second 
degré par rapport aux trois variables (x, y, z) : avec la 
terminologie définie précédemment, on précisera qu’il 
s’agit d’une forme ternaire quadratique. 

— Le polynôme : 

f= a, x 1 + a 2 x 2 + ••• + a n x n (1) 

est une forme linéaire à n variables (x 1f x 2 , ... x n ). 

— Le polynôme : 

f = ax+ by (2) 

est une forme binaire linéaire ; on l’appelle aussi une 
forme bilinéaire (deux variables du premier degré). 


• L ’intérêt de l'étude des formes algébriques est 
multiple. 

1 - Les formes algébriques servent au traitement 
analytique des problèmes de géométrie projective (y oir 
p. 87). 

2 - La résolution des équations fait intervenir 
des formes algébriques. 

3 - La recherche des « lieux géométriques » 
(courbe, surface, famille de courbes, etc.), en géomé¬ 
trie analytique (voir p. 150), conduit à utiliser des 
formes algébriques. 

4 - On les retrouve aussi en théorie des nombres 
(représentation d’un nombre par une forme quadrati¬ 
que), comme on l’a vu p. 32. 

Etc. 


Formes équivalentes, invariances. 


• Transformations linéaires. Considérons une 
forme algébrique f de variables x v x 2 ,... x n . On appelle 
transformation linéaire de la forme f l’opération qui 
consiste à remplacer les variables x, par des variables 
x/reliées aux anciennes par une combinaison linéaire. 
La nouvelle forme f' obtenue est dite transformée de f. 

Par exemple, soit la forme binaire quadratique 
f = x 2 — y 2 et considérons la transformation linéaire : 


x = 3 x' + 8 y' ; 
y = 4 x' + 6 y' . 


La forme f s’écrit : 


(3) 


f = (3 x' + 8 y') 2 - (4 x' -F 6 y') 2 = - 7 x' 2 -F 28 y' 2 . (4) 

La forme f = - 7 x' 2 -F 28 y' 2 est équivalente à la 

forme f = x 2 - y 2 , par la transformation (3). 

D’une manière générale une transformation linéaire 
qui change les variables (x 1t x 2 , ..., x n ) en (xj, x 2 ,..., x' n ) 
est de la forme : 

f *1 = a n xj + a 12 x 2 + ::: + a 1n x' ; 

I X 2 = a 2 -| "f” 3 22 X 2 “F “F a 2n x n , 

< : (5) 

( x n = a n1 x\ + x 2 H + a nn x'. 

Cette transformation, définie par les coefficients 
indexés a jjt substitue à la forme f(x 1? ... x n ) une forme 
f'(x\, ... x n ) qui lui est équivalente. 

• Expression vectorielle et matricielle. Nous 
avons dit, page 48, qu’une suite de nombres (x-i, x 2 , 
..., x n ) était un vecteur. Nous pouvons donc dire que la 
transformation linéaire (5) change le vecteur x de 
composantes (x 1f x 2 , ..., x n ) en un vecteur x', de 
composantes (x-j, x 2 , ..., x n '). 

D’autre part appelons le vecteur de composantes 
(a^, a 12 , a 1n ). Le deuxième membre de la première 

équation (5) n’est autre que le produit scalaire A y .x\ 
(revoir la définition du produit scalaire de deux vec¬ 
teurs au n° 512.5, G, c et ci-dessus, au paragra- 
teurs p. 48 et p. 61). 

En appelant de même A 2 , A 3 , ..., A n les vecteurs 
analogues à A-,, la transformation linéaire (5) s’écrit 
simplement : 

x, = A i .x;. (6) 

C’est-à-dire qu’une variable x, quelconque est le pro¬ 
duit scalaire des vecteurs A, et x;. 

• Formes équivalentes. Deux formes qui se 
correspondent par une transformation linéaire sont 
équivalentes. On peut se demander alors ce qu’il 
advient des coefficients de la forme transformée. Dans 
l’exemple (3) ci-dessus, la forme f avait pour coeffi¬ 
cients + 1 et -1 ; elle est transformée par les 
formules (3) en une forme f de coefficients — 7 et 28. 
Comme la transformation est linéaire, nous sommes 
certains que f et f sont équivalentes. 

Prenons maintenant le problème à l’envers : étant 
donné deux formes f et f, peut-on dire qu’elles sont 
équivalentes d’après l’examen de leurs coefficients ? 
Par exemple, f = 5 x' 2 - 3 y' 2 est-elle équivalente à 
f = x 2 — y 2 ? Pour résoudre ce problème il faut trouver 
une transformation linéaire : 

f x = ax' -F by' m 

jy = ex' -F dy' 

qui permette de passer de f à f, c’est-à-dire il faut 
déterminer les coefficients a, b, c et d du système (7). 
Le problème est relativement simple pour une forme 
binaire, linéaire ou quadratique ; il devient rapidement 
compliqué, lorsque le nombre de variables et le degré 
de la forme augmentent. 

• Invariants. Toute fonction des coefficients (ou 
des variables et des coefficients) qui reste identique¬ 
ment égale pour toutes les formes équivalentes d’un 
système, est appelée un invariant. L’étude des inva¬ 
riants des divers types de formes algébriques est un 
chapitre très important de la théorie des formes algé¬ 
briques. 
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FORMES LINÉAIRES ET QUADRATIQUES 


Formes linéaires. 

• Écriture vectorielle. Le polynôme f de la 
relation (1) ci-dessus est, on l’a dit, une forme linéaire 
des n indéterminées (variables) x v x 2 ,..., x n . Au lieu de 
l’écrire sous la forme (1), nous pouvons nous conten¬ 
ter d’énumérer les coefficients du polynôme f, c’est-à- 
dire de définir f par le vecteur à n dimensions : 

f = (a 1f a 2 , ..., a n ) . (8) 

Avec cette remarque, nous pouvons combiner les 
formes linéaires comme des vecteurs. Soit par exemple 
deux formes linéaires : 

| = ( a l> a 2« ■— a n) î (9) 

I f „ = (b„ b 2 , .... b„). 

On obtient la forme linéaire : f s = f a +f b e * les 
formes A*. et kf h par application des lois du calcul 
vectoriel expliquées p. 47 : 

f s = (a 1 + b„ a 2 + b 2 , ..., a n + b n ). (10) 

| \f a = (A a 1t Aa 2 , ..., Aa n ) ; (11) 

1 A f b = (A b„ A b 2 , ..., A b n ) . 


Les m formes linéaires f a , f b , ..., f n seront dites 
linéairement dépendantes ou linéairement indépen¬ 
dantes selon que les vecteurs qui les représentent sont 
eux-mêmes linéairement dépendants ou linéairement 
indépendants. 

• Écriture vectorielle d’un système homogène. 
Un système de n équations du premier degré est dit 
homogène si le second membre de chaque équation 
est nul. Il s’écrit de la façon suivante : 


X 1 “F â-| 2 X 2 4" 

X 1 ~F ^ 22 X 2 “F 

• + am*n = 0; 

• + a 2n x„ = 0 ; 

x, + a„ 2 x 2 + • 

” + a nn x „ = 0 


— Une forme quadratique à n indéterminées 
s’écrit : 

f=a„x 1 2 +a i2 x 1 x 2 +- 

+ a 22 x| + ’ a 23 x 2 x 3 + ••• + a„„x 2 , (19) 

ou encore, en utilisant le symbole des sommes : 

f= X 2 a„x,xj, (20) 

i =1 i =/ 

en convenant que si / = j, x,x y = x 2 . 

• Expression matricielle. Les coefficients af¬ 
ferment une matrice carrée A = [a, y ] d’ordre n, appelée 
matrice de la forme quadratique n. Le rang de A est 
appelé rang de f. Si ce rang est égal à n, c’est-à-dire si 
toutes les lignes et toutes les colonnes sont linéaire¬ 
ment indépendantes, la matrice est non-singulière. 
D’autre part, comme a /y = a y7 , A est une matrice symé¬ 
trique (voir éventuellement les définitions relatives aux 
matrices p. 60). Posons : 


x^ 


X = 


x 2 


X n 


( 21 ) 


et considérons sa transposée : 

f X= [x 1 x 2 ... x n ] ; (22) 

On montre que la forme (19) peut aussi s’écrire 
f = ( XAX. 

• Forme canonique. Il est possible de trouver 
une transformation linéaire qui change les indétermi- 

nées (x„ x 2 . x„) en (y„ y 2 . y„), de sorte que la 

forme quadratique se présente sous la forme : 

F — b, y, 2 + b 2 y|+ - + b„y„ 2 . (23) 

Cette forme F est la forme canonique des formes 
quadratiques f. La matrice T qui change X en Y est 
non-singulière. 


La réduction à la forme canonique est un exercice 
assez fastidieux que nous n’illustrerons pas ici. On 
procède en général de proche en proche, par une série 
de transformations linéaires qui font apparaître les 
carrés des indéterminées. Ainsi la forme quadratique 

f = 2 xy - 6 y z + 2 xz 


se réduit à la forme canonique 


F 



■ 4- 6 Z 


;2 


par la matrice de transformation : 



0 0 1 _ 


(24) 


On notera qu’une forme quadratique a plusieurs 
formes canoniques, qui dépendent de la transforma¬ 
tion T utilisée. 

• Formes normales. Si la forme quadratique est 
complexe, on montre qu’il existe une forme canonique 
dont tous les coefficients sont égaux à 1, c’est-à-dire 
qui s’écrit d’une manière générale : 

f = z * + z l + ...+ z * n . (25) 

Si la forme quadratique est réelle, on peut trouver 
une forme canonique telle que tous les coefficients 
soient égaux à 4-1, à -1 ou à 0. De telles formes 
canoniques sont dites formes normales. 

• Formes quadratiques positives. Une forme 
quadratique f est dite définie positive si sa forme 
normale est la somme des carrés des variables avec les 
coefficients +1, ou encore si f est de rang n. On peut 
démontrer le théorème suivant, en considérant le 
déterminant de la matrice des coefficients d’une forme 


Appelons x le vecteur de composantes (x 1f x 2 ,x n ) 
et A v A 2 , .... A n les vecteurs représentant les coeffi¬ 
cients des n équations. Le système (12) peut s’écrire 
vectoriellement de la façon suivante : 


rx. a, = o 
lx. A 2 = 0 

.(x. A„ = 0 


(13) 


puisque chaque équation développe le produit scalaire 
des vecteurs x et A, (voir p. 48). Le problème revient 
donc à déterminer un vecteur x orthogonal à tous les 
vecteurs A^, A 2 , ..., A n . 


6x6 matrice destinée à résoudre le problème-jeu des 30 cubes colorés, qui est un jeu mathématique classique 
(d’après Scientific American, septembre 1978). 



Formes quadratiques. 

• Exemple. En géométrie analytique, on montre 
qu’une conique (c’est-à-dire un cercle, une ellipse, une 
parabole ou une hyperbole) peVt être représentée par 
une équation de la forme : 

f = Ax 2 4 - 2 Bxy + Cy 2 , (14) ^ 

dans laquelle A, B, C sont des coefficients caractéristi¬ 
ques de la courbe, x et y les coordonnées d’un point 
quelconque de la courbe. 

L’équation (14) définit une forme binaire quadrati¬ 
que (deux variables : x et y ; tous les termes sont du 
second degré en xy). D’autre part on montre que f peut 
se mettre sous la forme équivalente : 

f=A'x' 2 +C'ÿ 2 (15) c 

par une transformation linéaire convenable des varia¬ 
bles (géométriquement, cette transformation consiste 
en une rotation des axes de coordonnées autour de 
l’origine ; voir p. 99). 

La forme (15) est appelée forme canonique de 
l’équation d’une conique. 

Nous allons étudier ici les formes quadratiques en 
général, c’est-à-dire les polynômes fan indétermi- ^ D 

nées x v x 2 .x n , dont tous les termes sont soit de la g 

forme x, 2 (/' = 1, 2, ..., n) ou x, x y (/V/). 

<3 

• Notation. Nous appellerons a <y les coefficients £ 

des termes en x. x., et a., les coefficients des termes en | 

y 2 ' ! * 

*/" „ .O 

— Une forme binaire quadratique s’écrira donc : S 

f=a 11 x 1 2 4-a 12 x 1 x 2 + a 22 xf, (16) | ^ 

expression que l’on comparera avec (14). .c 

— Une forme ternaire quadratique s’écrira : J 

f=a 11 x 1 2 +a 12 x 1 x 2 + a 13 x 1 x 3 * 

4 - a 22 x 2 2 + a 23 x 2 x 3 4 - a 33 x 3 . ( 17 ) ~ 

En appelant x, y, z les variables, et A, B, C, D, E, F & 
les coefficients, f. s’écrirait sous la forme : © 

f = Ax 2 + Bxy + Cxz + Dy 2 4- Eyz 4- Fz 2 . (18) S F 









* 
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LES POLYNOMES 

quadratique : pour qu’une forme quadratique f de n 
variables à coefficients réels soit une forme définie 
positive, il faut et il suffit que tous ses mineurs 
principaux soient positifs. 

Tenseurs. 

Remarques historiques. 

La notion de tenseur et l 'analyse tensorielle qui lui 
est associée ont une origine à la fois pratique et 
théorique. 

Par « pratique », nous entendons ici les besoins des 
physiciens. Ceux-ci, lorsque les règles du calcul vecto¬ 
riel furent bien établies, se sont largement servis de ces 
êtres mathématiques pour représenter divers aspects 
des réalités physiques et ils ont contribué au dévelop¬ 
pement de I analyse vectorielle en introduisant les 
notions de flux, de divergence, de rotationnel, etc. A 
ces travaux de physique mathématique sont associés 
les noms de Stokes, Maxwell, Heaviside, Gibbs, 
Lorentz. Parallèlement, les mathématiciens ont précisé 
la théorie et l’axiomatique de l’analyse vectorielle 
(diffusion des travaux de Riemann et de Grassmann, à 
partir de 1870). A la fin du XIX e siècle, l’étude des 
tensions à l’intérieur d’un solide déformé a conduit les 
physiciens à étudier un système de six nombres, 
susceptible de varier en même temps que les coordon¬ 
nées d’un point, et que Voigt, auteur de travaux de 
physique cristalline, nomma un tenseur (1898). Le 
terme fut repris par Gibbs (1902), et les physico¬ 
mathématiciens de cette époque utilisèrent ce concept 
pour étudier la statique des milieux continus, et préci¬ 
sèrent les lois du calcul tensoriel. 

Par « théorique » il faut entendre les recherches 
effectuées par les mathématiciens dans le domaine de 
la géométrie différentielle, c’est-à-dire de la géométrie 
qui fait appel au calcul différentiel et au calcul des 
dérivées pour étudier des notions telles que celle de 
courbure par exemple. Ces travaux remontent à Rie¬ 
mann (1854) et à Christoffel (1869) ; ils ont donné 
naissance à une théorie générale appelée calcul diffé¬ 
rentiel absolu, ou, comme on dit de nos jours, analyse 
tensorielle explicitée par l’Italien G. Ricci (1884), puis 
Levi-Civita (1901). 

L’analyse tensorielle fournit l’algorithme nécessaire 
à l’exposition de la théorie de la relativité générale 
(Einstein, 1916) et se révèle un outil de choix pour 
décrire certaines théories physiques (mécanique quan¬ 
tique, mécanique des fluides, théorie de l’élasticité, 
etc.). La théorie elle-même s’est précisée en 1917 
(introduction de la notion de translation dans la géo¬ 
métrie riemannienne par Levi-Civita et Schouten), 1918 
(espaces à connexions affines de Schouten et H. Weyl) 
et 1936 (variétés différentielles, Whitney). 

De quoi s'agit-il ? 

Le calcul tensoriel est une théorie trop abstraite pour 
être résumée dans le cadre de cet ouvrage. On retien¬ 
dra ici qu’un tenseure st un tableau de « nombres » (ou 
d’éléments abstraits) qui dépend d’un système de 
coordonnées qui se transforment selon des règles 
déterminées. 

Considérons par exemple deux points Pet O dans un 
espace à n dimensions ; appelons x, les coordonnées 
de Pet y k celles de Q, i et k prenant toutes les valeurs 
de 1 à n. Le tableau de tous les produits x,y k est un 
tenseur, dont chaque valeur de x,y k est une compo¬ 
sante. La notion peut être généralisée ; elle fait alors 
l’objet du calcul tensoriel, dont les applications en 
physique mathématique et en mathématiques pures 
sont nombreuses et fécondes. 

Voici comment on peut définir, d’une manière géné¬ 
rale, la notion de tenseur. Considérons deux espaces 
vectoriels sur un corps K, notés Eet E* ; appelons vun 
vecteur de E, v* un vecteur de E* ; les vecteurs nuis 
des deux espaces seront notés O et CFL Si les deux 
conditions suivantes sont satisfaites, à savoir : 

1 - on sait faire correspondre à tout couple 
( v , v *) un scalaire kŒK appelé produit scalaire des 
vecteurs v et v* (lorsque k= 0, les vecteurs sont dits 
orthogonaux) ; 

2-0 est le seul vecteur de Equi soit orthogonal 
à tout vecteur v * de E*, et O* est le seul vecteur de E* 
qui soit orthogonal à tout vecteur v de E ; 

Alors les espaces E et E* sont dits duals. Cela dit, 
soit p espaces E v E 2 , ..., E p de dimensions finies sur un 
corps K et considérons le produit cartésien des duals 
E? x E% x ... x E*. L’espace vectoriel des formes 
p-linéaires sur ce produit est appelé espace produit 
tensoriel des espaces E v E 2 , ..., E p et chaque élément 
de cet espace est appelé un tenseur. Le produit 
tensoriel des espaces E v ..., E p se note par le 
symbole 0. 


POLYNÔMES ET THÉORIE 
DES ÉQUATIONS. 

Après l’algèbre des structures — qui est la forme la 
plus générale de l’algèbre qui conditionne toutes les 
autres — et l’algèbre linéaire — qui est l’outil par 
excellence des branches les plus importantes des 
mathématiques — il nous reste à présenter l’algèbre 
classique, dont l’objet est principalement la théorie des 
équations. Nous y inclurons l’étude des polynômes et 
celle des fractions rationnelles. 

Les polynômes. 

Un exemple trivial. 

Plaçons-nous dans l’ensemble (R, qui est celui de 
l’algèbre élémentaire et appelons x un réel quelconque 
(ce qui s’écrit, rappelons-le, x e IR). Voici un exemple 
de calcul susceptible d’être effectué sur les nombres 
tels que x. 

Supposons que x désigne une longueur indéter¬ 
minée (mesurée en mètres) ; alors x 2 désignera la 
surface d’un carré de côté x et x 3 le volume d’un cube 
d’arête x. 

Imaginons qu’une personne achète : 

— une corde dont la longueur vaut trois fois la 
longueur x, c’est-à-dire 3 x mètres, et dont le prix est 
de 2 francs le mètre ; cette corde coûte donc : 

3 x x 2 = 6 x francs ; 

— un panneau de contre-plaqué de surface 2 x 2 
(en mètres carrés), au prix de 12 francs le mètre carré ; 
ce panneau coûte donc : 2x 2 x 12 = 24 x 2 francs ; 

— un tonneau de vin de capacité égale à x 3 (en 
mètres cubes), au prix de 2 francs le litre (c’est-à-dire 
de 2 000 francs le mètre cube, puisqu’il y a 1 000 litres 
dans un mètre cube); coût: 2 000 x 3 francs. 

Après ces achats, il lui reste 50 francs. On demande 
d’exprimer la somme que cette personne possédait 
initialement. Il est bien évident que cette somme 
dépend de x et qu’on ne peut la connaître, puisque x 
est indéterminé; néanmoins on peut l’exprimer en 
francs sous la forme 

50 + 6 x + 24 x 2 + 2 000 x 3 . (1) 

Une expression telle que (1) s’appelle un polynôme à 
une indéterminée (l’indéterminée est x) ; on la repré¬ 
sente souvent par P(x) qui se lit « P de x» (P est 
l’initiale du mot «polynôme»). 

Les achats d’une seconde personne conduiraient à 
établir, par exemple, le polynôme 

P^x) = 30 4- 2 x - 15 x 2 4- 50 x 3 , (2) 

le signe « - » devant 15 x 2 signifiant une dette équiva¬ 
lente à la somme 15 x 2 francs. Pour une autre personne 
on pourrait avoir : 

P 2 (x) = 15-2x4-3 x 2 , (3) 

etc. 

Ce qui distingue les polynômes P, P v P 2 , ..., ce n’est 
pas la présence de l’indéterminée x à la puissance 1, à 
la puissance 2, etc., c’est l’ensemble des coefficients : 

(50, 6, 24, 2 000) pour le premier polynôme; 

(30, 2, —15, 50) pour le deuxième polynôme; 

(15, -2, 3) pour le troisième polynôme. 

Enfin, on peut, bien entendu, envisager des opéra¬ 
tions sur les polynômes telles que P+ P 1t ou Px P v 

Ces remarques vont nous conduire à une définition 
un peu plus générale des polynômes. Dans ce qui suit, 
x définira toujours la grandeur indéterminée sur 
laquelle on calcule, et les coefficients seront notés à 
l’aide de lettres minuscules comme a, b, c ,... ou — afin 
de ne pas épuiser trop vite l’alphabet — par des lettres 
minuscules affectées d’un indice, c’est-à-dire d’un 
nombre entier (0, 1, 2, ...) écrit en petits caractères en 
bas et à droite d’une lettre : 

a! se lit « a un » ou « a indice 1 » . 

La notation indicielle, que nous avons déjà rencon¬ 
trée, effraye parfois les non-mathématiciens ; elle n’a 
pourtant rien de bien mystérieux : c’est simplement un 
moyen commode de multiplier à l’infini les lettres de 
l’alphabet. 

Polynômes dans le corps des réels. 

• Monômes. Considérons le corps, R, des réels 
et un élément quelconque, x, appartenant à IR. A tout x 
on peut associer un élément ax n , a étant un réel 
déterminé et n un entier. Autrement dit, on considère 
l’application : 

x ax n , xeR, aElR, n£N. (4) 


Une expression telle que ax n s’appelle un monôme. 
En voici quelques exemples : 


V2 - 

3 x (a = 3, n =5), -z-x' 
b 


a -7. 




a = - - , n =3) etc. 


(5) 


Le nombre n définit le degré du monôme : les trois 
monômes ci-dessus sont respectivement du cin¬ 
quième, du septième et du troisième degré. La conven¬ 
tion x° = 1 pour tout x nous conduit à considérer le 
réel a comme un monôme de degré zéro (a = ax°). 

• Polynômes. Un polynôme est la somme d’un 
nombre fini de monômes ; sa valeur pour x s’écrit P(x). 
On écrit généralement un polynôme en l 'ordonnant, 
c’est-à-dire en classant ses termes (les monômes) par 
ordre croissant ou décroissant de degrés (on utilise 
souvent l’ordre croissant pour les exposés théoriques, 
l’ordre décroissant pour les calculs). Le degré d’un 
polynôme est le degré du monôme de plus haut degré. 
Un polynôme de degré n s’écrit, par exemple : 

P(x) = a 0 +a 1 x+a 2 x 2 + ••• + a n x n (a n 9 ^ 0). (6) 

On peut aussi écrire, en abrégé, avec le signe S 
(sigma) qui indique une somme : 

P(x) = 2 a < * ' ’ ( 7 ) 

i = 0 

qui se lit : « somme de a,x' de/=0àn» et qui signifie 
qu’on obtient les termes successifs du polynôme P(x) 
en remplaçant / (l’indice général) par toutes les valeurs 
entières 0, 1, 2, 3, ..., n. 

Habituons-nous à cette notation très usuelle en 
mathématiques. Écrivons par exemple le polynôme : 

P(co) = 2 A, co' , co G IR , A G IR , 

i = 0 

/ = {0,1,2... n} G N. (8) 

Nous avons choisi à dessein des lettres grecques : co 
(oméga) et A (lambda) pour familiariser le lecteur avec 
les notations usuelles. L’expression précédente signi¬ 
fie qu’on considère un polynôme dont la variable est le 
nombre réel (indéterminé) co, et dont les coefficients 
sont A 0 , A 1t ..., A n . Le terme de degré zéro (/' = 0) est le 
monôme A 0 co° = A 0 (puisque co° = 1 par définition). Le 
terme de degré 1 est A 1 co 1 = A., co ; celui de degré 2, 
A 2 co 2 ; et ainsi de suite jusqu’à A n co n , terme de degré n. 
On a donc : 


P(co) = ^ A,co , =A 0 4-A 1 co+A 2 co 2 -f”'4-A n co n . 

i = 0 


(9) 


Léopold Kronecker (1823-1891), mathématicien 
allemand dont les travaux ont concerné principale¬ 
ment la théorie des nombres et l’algèbre (théorie 
des corps de nombres algébriques). 
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LES POLYNOMES 


• Polynômes identiques. Deux polynômes sont 
dits identiques si, après réduction, leurs coefficients 
homologues sont égaux deux à deux. Par exemple les 
polynômes : 

P(x) = 5 - x + 2 x 2 et Q(x) = a - (a + b) x + 2 x 2 
sont identiques à la condition que : 

a = 5 et (a + b) = 1 , 
soit b = 1 - 5 = - 4. 

• Addition. La somme de deux polynômes est 
un polynôme dont chaque coefficient est la somme des 
coefficients correspondants des deux polynômes 
considérés. Par exemple : 

P{x) = 5 - x + 2 x 2 , Q(x) = 1 — 7 x 2 4-12 x 3 
ont respectivement comme coefficients : 

(5,-1,2) et (1,0,-7,12), 

le nombre 0 indiquant que Q(x) n’a pas de terme du 
premier degré. Les coefficients de S(x) = P(x) + Q(x) 
sont : 

(5 + 1, - 1 + 0, 2 - 7, 12) = (6, - 1, - 5, 12) ; 
on a donc : 

S(x) = 6 - x - 5 x 2 + 12 x 3 . (10) 

On vérifie sans peine que : 

— l’addition des polynômes est commutative et 
associative ; 

— il existe un polynôme neutre p tel que : 
P(x) 4- p = P(x) ; les coefficients de p sont : (0, 0, 0, ..., 

0) ; on dit que p est identiquement nul ; 

— à chaque polynôme P(x) correspond un 
opposé — P(x), obtenu en changeant de signe les 
coefficients de P(x). Par exemple, l’opposé de : 

P(x) = 2 - 5 x 4- x 2 

est : 

- P(x) = - 2 4- 5 x - x 2 . 

• Multiplication. Le produit de deux polynômes 
s’obtient en multipliant chaque terme de l’un par tous ^ 
les termes de l’autre et en formant la somme algébri- * 
que des produits partiels obtenus. Le résultat est un ^ 
polynôme dont le degré est égal à la somme des degrés @ 
des polynômes multipliés (voir la disposition du calcul ^ 
p. 140). La multiplication est associative, commutative, ^ 
distributive par rapport à l’addition ; l’élément neutre 
est le polynôme équivalent à 1, de coefficients (1,0, 0, 
.... 0 ). 

• Soustraction. Cette opération se ramène à 
l’addition : pour retrancher un polynôme Q(x) d’un 
polynôme P(x), on ajoute à P(x) l’opposé de Q(x). 

• Division. C’est l’opération inverse de la multi¬ 
plication ; elle est étudiée ci-après, p. 70. 

• Multiplication par un réel. Un polynôme 
P(x) = a 0 4- a 1 x 4- ••• 4- a n x n peut être multiplié par un 
nombre réel quelconque A {lambda). On obtient un 
polynôme dont les coefficients sont Aa 0 , A a 1t ..., Aa n . 

Nécessité d'une généralisation. 

En algèbre élémentaire, on enseigne à calculer sur 
les polynômes réels, dont nous venons de parler. 
Quand on donne à x des valeurs réelles, le polynôme 
P(x) prend lui-même des valeurs réelles correspon¬ 
dantes, qu’on écrit P(5) pour x = 5 par exemple, P(a) 
pour x = a. L’établissement d’une telle correspon¬ 
dance fait songer à l’idée de fonction : 

x—P(x). (11) 

Or nous avons vu que ce qui caractérise un poly¬ 
nôme, c’est l’ensemble de ses coefficients (qui, en 
algèbre élémentaire, sont des nombres réels et, très 
souvent, des entiers relatifs). On peut donc convenir, 
une fois pour toutes, d’écrire un polynôme à une 
indéterminée sous la forme : 

P = (a 0 , a,,a 2 .a„-, 0, 0, 0,...), (12) 

a 0 étant le coefficient du terme de degré 0 (appelé 
aussi terme constant) ; 

a, étant le coefficient du terme de degré 1 ; 

a 2 étant le coefficient du terme de degré 2 ; 

a n étant le coefficient du terme de degré n. 

Les coefficients des termes de degré supérieur à n 
sont nuis. Ainsi le polynôme du cinquième degré en x : 

P(x) = 1 4- x 2 — x 3 — x 4 4- x 5 , 

s’écrit aussi : 

P = (1,0,1,-1,-1, 1,0,0,...) 

(il n’y a pas de terme du premier degré, donc a^ = 0). 

Autrement dit, un polynôme peut être défini comme 
une suite infinie d’éléments dont tous les termes 
au-delà du rang n sont nuis (dans l’exemple qui 



Allégorie de la rencontre du connu et de l’inconnu. Dessin de Saul Steinberg. (The New Yorker Magazine, Inc., 1962.) 


précède : tous les termes au-delà du rang 5 sont nuis). 
En algèbre élémentaire (celle qu’on enseigne dans les 
collèges et les lycées), les éléments en question sont 
des nombres réels (corps IR) ou des relatifs (anneau Z). 
Le fait que l’ensemble des éléments a 0 , a 1t ... ait une 
structure d’anneau permet l’addition et la multiplica¬ 
tion de ces éléments selon les règles connues. 

Il est assez naturel de généraliser la notion de 
polynôme et d’appeler polynôme à une indéterminée, 
ou encore polynôme formel, toute suite de la forme : 

P = (a 0 . a,.a„,0,0,...), 

un élément a, quelconque appartenant à un anneau 
commutatif A qui n’est pas nécessairement l’anneau, 
Z, des relatifs ou le corps, U, des réels, mais un 
ensemble d’éléments quelconques. Les polynômes de 
l’algèbre élémentaire, sur lesquels des générations 
d’écoliers ont appris à calculer, se présentent alors 
comme un cas particulier des polynômes en général, 
dont nous allons maintenant étudier les propriétés. 

Les polynômes formels. 

• Définitions : 

1 - Polynôme. Soit un anneau A dont les élé¬ 
ments sont représentés par la lettre a munie d’un 
indice et dont l’élément neutre pour l’addition, dit 
élément nul, est noté par le symbole 0 (qui se lit 
« zéro »). Toute suite infinie telle que (a 0 , a l5 a 2 , ..., a n , 
0, 0, ...), a n désignant le dernier élément non neutre de 
la suite, est appelée polynôme formel et désignée par 
P = [aJ, a, désignant le terme général de la suite 
considérée (on obtient les termes particuliers en fai¬ 
sant successivement / = 0, / = 1, ..., / = n). 

2 - Degré d’un polynôme non nul. L’entier n qui 
affecte le dernier coefficient non nul s’appelle le degré 
du polynôme ; on écrit symboliquement d° P = n (lire : 
« degré de P = n »). 

3 - Par définition deux polynômes sont égaux 
(identiques) si tous leurs coefficients sont égaux. 

4 - Monôme. On appelle monôme un polynôme 
dont tous les éléments sont neutres sauf un seul. 

Un ensemble de polynômes formels sera désigné par 
la lettre < 3 > . La structure de l’ensemble & dépend des 
opérations définies sur les polynômes P. 


• Opérations dans l’ensemble9?. Ces opérations 
sont résumées ci-dessous. Soient deux polynômes 
P = [a,] et Q = [b,] dont les coefficients, a, et b,, 
appartiennent à un anneau A (revoir éventuellement la 
structure d’anneau pp. 41-42). On peut définir dans cet 
ensemble deux lois de composition interne (addition et 
multiplication des polynômes) et une loi de composi¬ 
tion externe (multiplication d’un polynôme par un 
scalaire) : 


1 - Addition. Définition : P + Q = [a, 4- bj. Pro¬ 
priétés : opération commutative, admettant comme 
élément neutre le polynôme identiquement nul (0, 0, 0, 
..., 0) ; chaque P = [a,] a un opposé : — P = [- a J. 

2 - Multiplication par un scalaire A El A. Défini¬ 
tion : AP = [AaJ. Propriétés : (A 4- fx) P = AP 4- /xP ; 
A(P 4- O) = AP + AO ; A(/xP) = (A^t) P. 

3 - Produit de deux polynômes. Définition : 
PQ = [cj, avec c, = S a t b s , où t + s = i (voir ci-des¬ 
sous l’explication de cette formule). 
d° (PO) = d° P 4- d° Q. Propriétés : opération commuta¬ 
tive ; associative ; distributive par rapport à l’addition ; 
admettant pour élément neutre le polynôme (1, 0, 0, ..., 
0), polynôme unité. 

Explication de la formule c,= L a ( b s . Soient, 

t+ s = i 

pour fixer les idées, les polynômes iP = [a,] = (a 0 , a 1f 
a 2 , 0, 0) et Q = [b,] = (b 0 , b 1f b 2 , 0, 0, ...). Calculons les 
coefficients du produit PQ = [cj en faisant successi¬ 
vement / = 0, 1, 2, ... Comme P et O comptent chacun 
trois éléments, on ne peut avoir que t = 0, 1, ou 2 et 
s = 0, 1, ou 2, donc i = t + s = 0,1,2, 3 ou 4. On a donc 
successivement : 


/ = 0 
i = 1 


f = 0^>s = 0 
t = 0 => s = 1 

t = 1 S = 0 


et Cq 3q Ôq , 

et c ! = a 0 b-, 4- a■, b 0 ; 


i = 2 

1 = 3 
/ = 4 


t = 04> s = 2 
t = 1 4>s = 1 
f = 2^> s = 0 

f = 1=>s = 2 
f = 2=>s = 1 

t = 2=>s = 2 


©t c 2 — a 0 b 2 4” a 1 b 1 4~ a 2 bg , 

et Cg — 3 -1 b 2 4~ a 2 b 1 , 

et — a 2 b 2 , 
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LA DIVISION EUCLIDIENNE 

soit 

PQ = (a 0 b 0 , a 0 t> 1 + a, b 0 , a 0 b 2 + a 1 b 1 + a 2 b 0 , 

ai t> 2 + s 2 3 2 ô 2 ). 

On remarque que d 0 (PO) = 2 + 2 = 4. 

— Structure de I ensemble 9?. L’existence des 
opérations 1 et 3 définies ci-dessus confère à l’ensem¬ 
ble 9P la structure d'anneau ; on*parle d’un anneau de 
polynômes. Si les coefficients sont pris dans un 
corps K, l’ensemble 9? est un espace vectoriel sur K 
(voir p. 47). Si on se limite à des polynômes de degré 
au plus égal à n, cet espace est à (n + 1) dimensions, 
puisqu’il y a (n + 1) termes dans un polynôme de 
degré n. 

Considérons donc un anneau de polynômes sur un 
corps K et désignons par x le polynôme (0, 1,0, 0...). 
En appliquant la règle donnant le produit de deux 
polynômes, on voit que x 2 = (0, 0,1,0...), 
x 3 = (0, 0, 0,1,0...) et, notant 1 le polynôme (1,0, 0...), 
on voit que le polynôme de coefficients a 0 , a^ a 2 ... a n 
s’écrit : 

a 0 + a 1 x + a 2 x 2 ... + a n x n . (13) 

On peut alors lui associer une fonction, dite fonction 
polynôme, qui au nombre x G K associe le nombre : 

a 0 + a 1 x + ••• + a n x n . (14) 

L’anneau des polynômes tels que P s’appelle anneau 
des polynômes à une indéterminée sur K et se note 
K[x]. Voici quelques cas particuliers d’anneaux de ce 
type, qui nous font retrouver — à titre d’exemple 
particulier — l’algèbre élémentaire. 

1 - L’anneau C[x] est composé des polynômes à 
coefficients a, complexes et dont la variable est 
complexe. 

2 - L’anneau R[x] comprend les polynômes à 
coefficients réels et dont la variable est réelle : c’est 
l’anneau étudié en algèbre élémentaire et rencontré 
plus haut (voir p. 66). 

3 - L’anneau Q[x] comprend les polynômes à 
coefficients rationnels dont la variable est rationnelle. 
<0>[x] est un sous-anneau de (R[x], qui est lui-même un 
sous-anneau de C[x], 

• Intégrité. Nous avons défini p. 42, ce qu’on 
appelle un anneau d’intégrité. Rappelons cette défini¬ 
tion : c’est un anneau dans lequel l’égalité : 

ac = bc, 

entraîne l’égalité a = b pour tout c ^ 0 (0 étant l’élé¬ 
ment neutre pour l’addition), propriété appelée loi de 
simplification pour le produit. Cette propriété peut 
aussi s’énoncer : si l’égalité ab = 0, avec a ié 0 et b ^ 0, 
est possible, alors la loi de simplification ne peut 
s’appliquer (ce qui signifie : le produit de deux facteurs 
non nuis ne peut être nul). En général les anneaux dont 
on se sert usuellement pour construire les polynômes 
sont des anneaux d’intégrité ; ils ont, en outre, un 
élément neutre pour la multiplication, ce qui en fait des 
domaines d’intégrité. Dans ce cas l’anneau 9f> construit 
sur de tels domaines est lui-même un domaine d’inté¬ 
grité. 

Division euclidienne. 

Nous raisonnerons, dans ce qui suit, sur des polynô¬ 
mes construits sur un corps K et constituant un 
domaine d’intégrité. L’ensemble de ces polynômes 
sera dénommé AC[x] ; mais la lettre K ne doit pas 
induire le lecteur en erreur : en général, lorsque K est 
un corps, l’anneau K[x] n’est pas un corps. Si le 
lecteur trouve ce qui suit trop abstrait, il peut rempla¬ 
cer tout polynôme A, B,... de l’anneau considéré par 
un polynôme à termes réels : mais il se privera alors de 
la généralité de la théorie. 

D’autre part, pour étudier ce qu’on appelle la division 
euclidienne des polynômes, nous écrirons ceux-ci, 
non pas dans l’ordre utilisé jusqu’ici : 

a 0 - a 1 x 1 + —h a n x n , 

c’est-à-dire l’ordre des puissances croissantes de x, 
mais dans V ordre des puissances décroissantes : 

a n x n + a n _ 1 x n_1 + - + a 2 x 2 + a 1 x+a 0 
(c’est l’ordre utilisé en algèbre élémentaire). 

• Division euclidienne des polynômes. On 
démontre le théorème suivant : étant donné, dans un 
anneau K[x~\, un polynôme A appelé dividende et un 
polynôme B appelé diviseur, distinct du polynôme 
identiquement nul, il existe, et d’une seule façon, deux 
polynômes Q et R appartenant à l’anneau K, appelés 
respectivement quotient et reste de la division de A par 
B, tels que : 

A = BQ + R, (15) 

avec d° R < d° B ou R = 0. 


La recherche des polynômes Q et R s’appelle la 
division euclidienne de A par B. Lorsque R = 0, l’équa¬ 
tion précédente s’écrit A = BQ, et l’on dit que B est un 
diviseur de A (ou que A est un multiple de B). 

• Disposition pratique. Pour diviser le polynô¬ 
me A par le polynôme B on détermine les termes 
successifs de Q (par degrés décroissants) en formant 
la suite des restes partiels A a , A 2 ,... jusqu’à ce qu’on 
parvienne à un reste tel que d° R < d° B ou R = 0, ce 
qui indique que la division est terminée. Voici le détail 
des opérations sur un exemple, avec : 

/A = - x 4 + 5 x 3 + x 2 + 1, 8 = 2 x 3 + x - 1 . 

1 - On pose la division comme une division 
numérique, en laissant des blancs au dividende, éven¬ 
tuellement, pour les degrés manquants (ici : un blanc, 
que nous avons signalé par un petit carré, à la place du 
terme en x qui manque dans A) : 

- x 4 + 5 x 3 + x 2 + □ + 1 1 2 x 3 + x - 1 


2 - On divise le premier terme de A (soit - x 4 ) 
par le premier terme de B (soit 2 x 3 ) et on inscrit le 
quotient sous la ligne horizontale. Ici, on obtient : 
- x 4 /2 x 3 = - x/2, et l’on écrit : 


- x 4 + 5x 3 + x 2 + D + 1 


2 x 3 + x - 1 
x 
2 


3 - On multiplie — toujours comme dans une 
division ordinaire — le diviseur B par le terme - x/2, 
ce qui donne le polynôme: - x 4 - x 2 /2 + x/2, etj’on 
soustrait ce polynôme de A, ce qui donne le premier 
reste partiel A v Pour effectuer la soustraction, on a 
intérêt à écrire le polynôme — x 4 — x 2 /2 + x/2 sous le 
polynôme A , en changeant les signes de tous ses 
termes ; le polynôme devient alors : 


x 4 + x 2 /2 - x /2 : 

A =-x 4 + 5x 3 + x 2 +□ +1 

X* +iL 2 _* 

2 2 


2 x 3 + x -1 
x 

_ 2 


A i = 


0 + 5 x 3 



x 

2 


+ 1 


4 - On refait les opérations 2 et 3 en considérant 
le premier reste partiel A a comme un nouveau divi¬ 
dende. Le terme obtenu ici au quotient est 
5 x 3 /2 x 3 = 5/2, qu’on inscrit à la suite de — x/2 ; la 
multiplication par B, puis la soustraction de A A donne 
le deuxième reste partiel A 2 : 


A 

- x 4 + 5 x 3 

+ X 2 

+ □ +1 

2 x 3 + x 


x 4 

x 2 
+ 2 

x 

_ 2 

x 5 
~2 + 2 

Ai = 

0 + 5 x 3 

3 x 2 

-1 - 



-5 x 3 


5 x 5 

2 + 2 


a 2 = 


3 x 2 
2 

-3 x +^ 

2 



5 - Le reste A 2 est de degré 2 (son terme de plus 
haut degré est, en effet, 3 x 2 /2) ; c’est donc le reste R 
cherché et l’opération est terminée. On a 
Q = - x/2 + 5/2 et l’on peut écrire A = BQ + R, c’est- 
à-dire : 


( — x 4 + 5x 3 +x 2 + 1) = 

3 / x 5\ 3 x 2 _ 7 

= (2 x + x — 1) (-2 + 2 ) + T"~ 3x+ 2- 

Le quotient Q et le reste R s’écrivent aussi (pour 
faire apparaître des coefficients entiers) : 

Q = -|(x- 5) et R =|(3x ! -6x +7). 


On trouvera énoncées quelques conséquences fon¬ 
damentales relatives à l’existence d’un couple unique 
de polynômes tels que Q et F? p. 141. 


Racines d'un polynôme. 

• Définition. Soit un polynôme P appartenant à 
l’anneau K[x ]. Pour fixer les idées nous supposerons 



Jean Le Rond D’Alembert (1717-1783) : il fut, avec 
Diderot, l’animateur de /'Encyclopédie, mais aussi 
un mathématicien, qui s’est notamment illustré par 
ses efforts pour démontrer /e théorème fondamental 
de l’algèbre, en 1746 (ce théorème sera démontré 
complètement, pour la première fois, quelques 
années plus tard, par Gauss). 


que le corps K est le corps des complexes. On appelle 
racine de ce polynôme toute valeur x (E K pour laquelle 
ce polynôme prend la valeur 0. Par exemple : 

— Le polynôme /4(x) = 3 x 2 - 5 x + 2 s’annule 
pour les valeurs x 1 = 1 et x 2 = 2/3 (il suffit de rempla¬ 
cer x par x! ou par x 2 et de faire les calculs pour le 
vérifier). On peut donc écrire A(1) = A(2/3) = 0. Les 
nombres 1 et 2/3 sont les racines du polynôme A(x) ; 
on remarque qu’elles sont toutes deux réelles. 

— Le polynôme B(x) = x 2 -2x+2 s’annule 
pour X-, = 1 + i et x 2 = 1 i. Ici aussi, nous laissons au 
lecteur le soin de le vérifier. On peut donc écrire, 
comme précédemment, B(1 + i) = B( 1 - i) = 0 : les 
deux nombres 1 ± i sont les racines du polynôme B(x). 
On remarque qu’il s’agit de deux nombres complexes 
conjugués. 

• Division par x - a. On démontre le théorème 
suivant : le reste de la division d’un polynôme par x - a 
s’obtient en remplaçant x par a dans ce polynôme. 
Donc : une condition nécessaire et suffisante pour 
qu’un polynôme soit divisible par x - a est que a soit 
une racine de ce polynôme : en effet, si un polynôme 
A(x) est divisible par x — a, cela signifie que le reste de 
la division de A{x) est nul, or, d’après le théorème 
précédent, ce reste a pour valeur A(a). La condition 
A(a) = 0 exprime que a est une racine du poly¬ 
nôme A{x). 

• Zéros d’un polynôme. Soit P(x) un polynôme 
quelconque et a une racine de ce polynôme. Dans ce 
cas, en vertu de ce qu’on vient de dire, P(x) est 
divisible par x - a et l’on peut écrire : 

P(x) = (x — a) p Q(x). (16) 

a est appelé le zéro d’ordre p du polynôme P(x). Si 
p = 1, a est une racine simple du polynôme ; si p = 2, 
a est une racine double du polynôme ; si p = 3, a est 
une racine triple du polynôme ; etc. On démontre 
qu’un polynôme de degré n possède au plus n zéros 
distincts. Par exemple considérons les polynômes : 

P 1 (x) = (x-1)(x + 2) Q(x) 
et 

P 2 (x)=(x-1) 2 Q'(x). (17) 

P^x) est divisible par x — 1 et par x + 2 ; il admet 
donc comme racines x 1 = 1 et x 2 = - 2 ; ces deux 
racines sont des racines simples, et 1 et — 2 sont 
appelés des zéros d’ordre 1. D’autre part, le polynôme 
P 2 (x) est divisible par x - 1 deux fois de suite, mais il 
n’admet qu’une seule racine 3T = 1, qu’on appelle une 
racine double : 1 est ici un zéro d’ordre 2. 
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LES FRACTIONS RATIONNELLES 


• Factorisation. Soit P un polynôme construit 
sur le corps K ; si l’on peut mettre ce polynôme sous la 
forme : 

P = ABC ... N, (18) 

A, B, C, ..., N étant des polynômes (dont aucun n’est 
une constante) de l’anneau K[x], tous de degré infé¬ 
rieur à celui de P, on dit encore qu’on a décomposé le 
polynôme P en facteurs, ou encore qu’on l’a factorisé. 
Lorsque la décomposition n’est pas possible, le poly¬ 
nôme P est dit indécomposable. 

Un exemple très simple est celui d’un polynôme du 
deuxième degré tel que P = x 2 - 1, qui peut aussi 
s’écrire, en utilisant une identité bien connue donnant 
la factorisation d’une différence de carrés : 
P = (x + 1 ) (x - 1 ). P a été décomposé en un produit de 
deux polynômes, A et B, tous deux du premier degré, 
c’est-à-dire d’un degré inférieur au degré de P. Un 
polynôme tel que A = x + 1 est indécomposable, quel 
que soit le corps qui a servi à construire l’anneau 
considéré : lorsqu’on est parvenu à mettre un polynô¬ 
me Psous la forme d’un produit de facteurs du premier 
degré, on dit que la décomposition du polynôme est 
complète. 

• Le caractère décomposable ou indécomposa¬ 
ble d’un polynôme dépend essentiellement du corps 
de base choisi (sauf s’il s’agit d’un polynôme du 
premier degré, qui est toujours indécomposable). Par 
exemple, le polynôme P = x 2 + 1 est indécomposable 
sur le corps des réels. En effet, s’il existait une 
décomposition possible, elle devrait conduire à un 
produit de deux polynômes du premier degré de la 
forme 

x 2 + 1 = (x - a)(x- b), 

ce qui signifierait que P est divisible par (x — a) et par 
(x - b), autrement dit que a et b sont des racines de P. 
Or, un carré n’étant jamais négatif dans le corps des 
réels, une expression comme a 2 + 1 ou b 2 +1 n’est 
jamais nulle (on ne peut pas avoir a 2 = — 1), ce qui 
interdit à P d’avoir des racines réelles. Le polynôme 
x 2 + 1 est donc indécomposable sur le corps U. 

En revanche, sur le corps C des complexes, la 
décomposition est possible. En effet le polynôme 
x 2 + 1 admet deux racines complexes conjuguées : 

z = x + i et z = x — i, 

et l’on peut écrire x 2 + 1 =(x + i)(x-i). 

La question de la décomposition des polynômes sur 
les corps R et C est très importante : nous la retrouve¬ 
rons et la préciserons en étudiant la résolution des 
équations algébriques, p. 71. 


Les fractions rationnelles. 


— Le produit de deux couples est 

A A AA/ 

B X B' ~ BB ' ' 


( 2 ) 


On démontre que l’ensemble des couples distincts 
A/B forme un corps qui admet l’élément neutre 0/A 
pour l’addition, et A/A = 1/1 pour la multiplication. 
Tout élément non nul A/B a un inverse, B/A. Un 
polynôme A de l’anneau K[x] fait partie de ce corps si 
on l’écrit A = A/1. Ainsi A/B peut être considéré 
comme le quotient exact de A par B. 


Exemples dans le corps des réels. 

Si le lecteur a eu le courage de nous suivre jusqu’ici, 
il a pu constater que le calcul sur les polynômes se 
faisant aisément sans qu’on ait besoin de préciser dans 
quel corps on se plaçait (sauf pour la factorisation). 
Nous prendrons cependant nos exemples dans le 
corps des réels, car — en analyse notamment — on se 
place souvent dans cette perspective. Considérons 
donc les polynômes suivants, x désignant un nombre 
réel : 


A = x 2 + 2x+1, 

A ' 

= 3 x + 5 

B = x - 1 , 

B ' 

=x 2 -1, 

et les fractions rationnelles 

A x 2 + 2 x + 1 

A ' 

3x4-5 

B “ x-1 

B' 

“ x 2 - 1 


• Addition. Pour additionner A/B et A'/B', nous 
allons appliquer la règle donnée dans le cadre de la 
définition ci-dessus, et écrire : 

A A' AB' + BA' 

~B + W'~ BB' 

(x 2 + 2 x + 1)(x 2 — 1) + (x — 1)(3 x + 5) /0 , 
- - (x-D(x^î) ;(3) 

on effectuerait ensuite toutes les opérations : multipli¬ 
cation de (x 2 + 2 x + 1) par (x 2 - 1), etc., et l’on obtien¬ 
drait le résultat sous la forme d’une fraction 
rationnelle C/D. Pour simplifier les calculs, on peut 


procéder autrement, en remarquant que B et B' ont un 
facteur commun, (x-1), puisque: 

B = x — 1 et B' = (x 2 —1) = (x+1)(x—1). (4) 

Ainsi donc, B' = B(x + 1 ). Opérons donc de la sorte : 

A A (x + 1 ) A(x+1), , 

- remplaçons - par — + 1) = - (cela 

A x -F 1 , . , .. 

revient à multiplier — par ——, c est-a-dire par 1) , 

B x + 1 

A A ' 

— la somme — + — devient : 

B B 


A (x + 1) A ' A (x + 1) + /4' 

B' B' B' 

(x 2 + 2x + 1 )(x + 1 ) + (3 x +5) (5 - 

(x 2 - 1 ) 

Les calculs à effectuer sont moins nombreux et moins 
longs que dans le premier cas. L’exemple qui précède 
est très simple ; dans la pratique, le problème est 
parfois compliqué et exige des calculateurs une cer¬ 
taine « gymnastique intellectuelle » qu’ils perfection¬ 
nent en faisant de nombreux (... et ennuyeux !) exer¬ 
cices. 

• Simplification des fractions rationnelles. Soit 
une fraction rationnelle A/B dont le numérateur et le 
dénominateur peuvent se mettre sous la forme d’un 
produit de facteurs : 

A _ Al ■ A 2 . A 3 .... A n _ 

~B~ B,.B 2 .B 3 ....B n ' ( } 

On obtient une fraction rationnelle égale à A/B en 
éliminant les facteurs qui sont communs au numéra¬ 
teur et au dénominateur. Par exemple, la fraction 


A (x +1)(x 2 -5x + 9)(x 3 -x 2 -x -1) 

B~ (x + 1) (x 3 + 2 x 2 - x - 1) 

est égale à 

A' _ (x 2 — 5x +9)(x 3 — x 2 — x — 1) 

B 7- (x 3 + 2x 2 — x — 1) 

on a divisé le numérateur et le dénominateur par 
(x + 1), ce qui revient à diviser la fraction par 1, 
c’est-à-dire à la laisser identique. 


Ce sont les Babyloniens qui, au II e millénaire av. J.-C. (et peut-être même plus tôt), ont découvert les méthodes 
de résolution des équations du premier et du deuxième degré. La tablette cunéiforme ci-dessous (à 
gauche) contient plusieurs problèmes du second degré, résolus par la formule classique 


x 


- b ± Vb 2 -4 ac 
2 a 


en 


ne retenant que 


les solutions positives. Le savoir babylonien a été 


ignoré des mathématiciens grecs ; il a été retrouvé (?) par Diophante, au IV e siècle de notre ère, et transmis à 
l’Occident moderne par le mathématicien arabe al-Hârizmî (fin VIII e siècle-début IX e siècle), dans un traité célèbre 
dont on voit ci-dessous à droite un manuscrit de 1342. 


Définition générale. 

• Considérons l’anneau des polynômes, 
g>={A, B,...}, construit sur un corps quelconque K. 
Nous avons vu (ci-contre p. 68) qu’un polynôme A est 
divisible par un polynôme B s’il existe un polynôme O 
tel que A = BQ. Si ce polynôme n’existe pas, la 
division de A par B donne un reste, R, tel que : 


A = BQ + R, d° R < d° B. 

Nous nous trouvons donc limités, dans ( 3 > , comme 
nous l’avions été dans Z, où la division de l’entier a par 
l’entier b n’est pas toujours possible et impose 
d’écrire : 


a = bq + r, r< b. 


Pour passer outre à cette impossibilité, nous avons 
construit une extension de Z ; en d’autres termes, nous 
avons ajouté à l’anneau des entiers relatifs les frac¬ 
tions, considérées comme des couples d’entiers (x, x') 
et généralement désignées par x/x\ 

• On peut procéder de même avec les polynô¬ 
mes et agrandir l’anneau K[x ] des polynômes 
construits sur le corps K en un corps à l’aide des^ 
définitions suivantes. | 

— Soient A et B deux polynômes de l’anneau § 
K[x]. On considère les couples (A, B), qui peuvent être £ 
aussi notés A/B. Le premier terme du couple, A,| 
s’appellera le numérateur, le second terme du couple^ 
le dénominateur. Un couple tel que (A, B) sera appelé £ 
une fraction rationnelle. § 

— Deux couples A/B et A'/B’ sont égaux si, et| 
seulement si : AB' = BA'. ^ 


— La somme — + — est égale à 
B B 

A A ' AB'+BA' 
B + B'~ BB' 
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LES ÉQUATIONS 


• Multiplication et division. Les deux opérations 
se correspondent, puisque l’on a : 


ET 

S ' B ' ~ B X A ' ' 


( 8 ) 


• Principe général du calcul sur les fractions 
rationnelles dans U. Il est recommandé de procéder 
systématiquement de la manière suivante : 

1° - écrire les deux termes de chaque fraction 
sous la forme d’un produit de facteurs ; 

2° - simplifier la fraction rationnelle en suppri¬ 
mant les facteurs communs au numérateur et au 
dénominateur ; 

3° - effectuer les calculs demandés et exprimer 
le résultat sous la forme d’une fraction rationnelle dont 
les deux termes sont factorisés. 


Décomposition d'une fraction rationnelle en éléments 
simples. 

• Décomposition sur le corps des réels. 


Soit à décomposer la fraction rationnelle — ,A et B 

B 

étant deux polynômes en x premiers entre eux, en 
éléments simples. On est conduit, dans la pratique, à 
considérer plusieurs cas. 

1 - B ne contient qu’un facteur irréductible du 
second degré. 

On pose a priori la décomposition et l’on cherche les 
coefficients des numérateurs des fractions simples en 
utilisant les relations d’identité. 

Exemple : décomposer -^-. On pose a priori : 

x(x 2 + 4) 


4 _ A Bx + C 

x (x 2 + 4) ~ x + x 2 + 4 ’ 


(9) 


Pour déterminer A, B et C, on peut réduire au même 
dénominateur les deux fractions du second membre et 
identifier les deux numérateurs ; il vient : 


4 = A{x 2 + 4) + x(Bx + C) = (A + B) x 2 + Cx + 4 A , (10) 
d’où, en identifiant : 

A + B = 0 (le coefficient du terme en x 2 est nul à 
gauche), 

C = 0 (le coefficient du terme en x est nul à 
gauche), et 4 A = 4, 

ce qui donne : A = 1, B = - 1 et C = 0; 


donc : 


4 

x (x 2 4- 4) 


x 


X 

x 2 + 4 ' 


( 11 ) 


2 - B contient un facteur du second degré seule¬ 
ment, mais répété. 

Cela signifie que ce facteur est de la forme 
(x 2 + px 4- q) n . La fraction rationnelle peut être décom¬ 
posée en n éléments simples comme précédemment. 

Exemple : décomposer la fraction 
On pose : 


1 


x(x 2 + 1) 2 
Dx + E 


1 A Bx -h C 

x(x 2 + 1) 2 x + x 2 + 1 + (x 2 + 1) 2 ’ 

et l’on obtient, après calculs, l’identité : 

1 = (A + B) x 4 + Cx 3 4- (2 A + B + D) x 2 

+ (C + E)x + A, 

d’où l’on tire : 

A = 1,B = — 1,C = E = 0 et D = - 1 , 
ce qui donne : 

1_x x_ 

x 


( 12 ) 


(13) 


(14) 


x (x 2 +1 ) 2 x x 2 + 1 (x 2 + lf 

• Décomposition sur le corps des complexes. 

Sur ce corps, le dénominateur de la fraction ration¬ 
nelle à décomposer est toujours décomposable en un 
produit de facteurs du premier degré (théorème fonda¬ 
mental de l’algèbre). On obtiendra donc des éléments 

simples de la forme-, a étant une racine, réelle 

(x - a) a 

ou complexe, du dénominateur. 

On dit aussi que a est un pôle (complexe ou réel) 
pour la fraction considérée. 

Exemple : décomposer en éléments simples la 
fraction 1 


x 3 -r _ 

Le dénominateur admet trois racines, 1, j, j :: = j ; on 
a immédiatement : 


—!- A ( —+ —L + -4)- 

x 3 1 3 v x -1 x-j x-j 7 


(15) 


Si la fraction est réelle, on peut grouper les éléments 
simples dont les numérateurs sont complexes conju¬ 
gués : cela permet parfois d’obtenir la décomposition 
sur le corps des réels. Ainsi, dans l’exemple précédent, 
on a : 


j , \ __ (j + j )x - 2 jj 

x-j x-j x 2 — ( j + j)x + jj 


(16) 


et, comme j j = 1 et j + j = — 1, on obtient : 

1 _ 1 /_1_ x + 2 \ 

x 3 - 1 3 Vx -1 x 2 + x + 1 / 


(17) 


Les équations algébriques. 

Qu'est-ce qu'une mise en équation? 

• Un conte oriental. Il était une fois, il y a cinq 
mille ans, un méchant gouverneur qui dirigeait le 
grenier d’une ville située dans le pays des Sumériens, à 
proximité du golfe Persique. Il était fort craint des 
scribes, à qui il demandait régulièrement l’état du 
trésor, car le roi de la ville était dépensier et le trésor 
était toujours vide ; pis encore, ce roi avait des dettes, 
car il empruntait au roi d’une ville voisine des sacs de 
grains pour payer les salaires de ses fonctionnaires. 
Aussi, lorsque le gouverneur du grenier royal deman¬ 
dait au scribe chargé de tenir les comptes : « Combien 
reste-t-il de sacs de grains dans le grenier ? », le scribe 
répondait toujours : « Il n’y a plus de sacs et, en outre, 
nous devons trois sacs (ou cinq sacs, ou dix sacs, cela 
dépendait) à la ville voisine. » Irrité de cet état de 
choses, le gouverneur, dont l’esprit était faible, prit la 
décision de condamner à mort tout scribe qui aurait 
l’audace de lui répondre que le roi avait une dette de 
tant de sacs de grains. Après qu’on eut ainsi empalé 
une demi-douzaine de scribes-comptables, plus per¬ 
sonne ne voulait remplir cette dangereuse fonction. Il 
se trouva cependant quelqu’un pour faire acte de 
candidature et, à ses amis qui lui disaient : « Toi aussi 
tu seras supplicié », il répondait, d’un air entendu, que 
pareille mésaventure ne lui arriverait jamais. Une fois 
en place, il eut l’occasion de recevoir la visite du 
gouverneur, qui lui posa la question fatale : « Combien 
reste-t-il de sacs de grains dans le grenier ? », en 
ajoutant la menace suivante : « Si tu me réponds que 
nous avons des dettes, tu seras empalé, et si tu mens, 
tu seras aussi empalé. » Le scribe, sans se démonter, 
lui répondit : « Puissant gouverneur, trois fois le nom¬ 
bre de sacs qu’il y a dans ce grenier plus sept sacs, cela 
donne le même résultat que si l’on ajoutait quinze sacs 
au nombre de sacs de ce grenier multiplié par cinq. 
Voilà ce que tu possèdes ! » Comme beaucoup de 
fonctionnaires autoritaires et cruels, le gouverneur 
était bête et il ne comprit pas la réponse du scribe. 
Néanmoins, comme celui-ci n’avait pas parlé de dettes, 
il décida de ne pas l’empaler pour ce motif et se rendit 
dans le grenier pour vérifier si ce que lui avait dit le 
comptable était vrai. Quelle ne fut pas sa stupeur de 
constater que le grenier était vide et que les livres de 
comptes mentionnaient que le roi avait une dette de 
quatre sacs de grains à l’égard de la ville voisine ! Il 
retourna auprès du scribe et lui dit : « Tu ne m’as pas 
annoncé de dettes, soit, mais tu as menti, je vais donc 
te faire exécuter. » Le scribe se défendit en souriant et 
expliqua au gouverneur : « Pas du tout, je ne t’ai pas 
menti. Voici comment s’explique ma réponse. Le roi 
doit bien quatre sacs à la ville voisine ; si tu multiplies 
cette dette par trois, cela fait douze sacs de dette et si 
tu fais entrer sept sacs dans le grenier, il ne restera 
plus que cinq sacs de dette ; par ailleurs, quatre sacs 
de dette multipliés par cinq, cela fait vingt sacs de 
dette ; si tu ajoutes à ces vingt sacs de dette quinze 
sacs de crédit, cela ne fait plus que cinq sacs de dette, 
c’est-à-dire le même nombre de sacs de dette que tout 
à l’heure. Je ne t’ai donc pas menti, et je t’ai fait savoir 
qu’il y avait quatre sacs de dette sans cependant te le 
dire directement : je ne dois pas être condamné. » Et 
c’est ainsi que la vie de ce scribe avisé fut sauvée grâce 
à sa subtile invention, à laquelle les mathématiciens 
donnèrent plus tard le nom de théorie des équations. 

Bien entendu, cela est un conte. Reprenons point par 
point les affirmations du scribe et traduisons-les dans 
notre langage actuel. 

— Il ne veut pas énoncer le nombre de sacs de 
grains qui reste dans le grenier ; appelons donc ce 
nombre x et déclarons que c’est une quantité incon¬ 
nue (ou, plus brièvement, une inconnue). Convenons 
que si x est positif il s’agit de sacs de grains entassés 
dans le grenier et que si x est négatif il s’agit de sacs de 
grains dus à la ville voisine. 


— Trois fois le nombre de sacs plus sept sacs, 
cela s’écrit 3 x + 7. 

— Cinq fois le nombre de sacs plus quinze sacs, 
cela s’écrit 5 x T 15. 

— Dire que les deux quantités sont égales, cela 
s’écrit : 

3x + 7 = 5x + 15, 

égalité qui n’est vérifiée que pour une seule valeur de 
x, la valeur x = - 4. En effet, les deux membres de 
l’égalité prennent la même valeur si l’on remplace x par 

-4 : 

3 x (— 4) 4- 7 =-12+ 7 = - 5 , 

5x(— 4)+ 15 = — 20 + 15 = — 5. 

Une égalité comme celle qui est posée par le scribe, 
vérifiée seulement pour certaines valeurs de l’incon¬ 
nue x, s’appelle une équation ; chercher x à partir de 
cette équation, cela s’appelle résoudre l’équation et la 
valeur trouvée, x = - 4, est la racine ou la solution de 
l’équation considérée. Nous remarquons que la solu¬ 
tion trouvée est négative : autrement dit le scribe aurait 
été dans l’ impossibilité de répondre comme il l’a fait 
s’il avait ignoré l’existence des nombres négatifs. Cela 
nous montre que, selon l’ensemble de nombres consi¬ 
déré, une équation peut être possible dans un ensem¬ 
ble et impossible dans un autre. 

• Définitions. Soyons plus rigoureux et préci¬ 
sons dès maintenant quelques définitions. 

1 - Nous nous placerons d’emblée dans 
l’ensemble C, des nombres complexes. 

Avec cette convention préliminaire, toutes les opéra¬ 
tions élémentaires sont possibles ; par exemple : 

3-5= -2, 3 : 7 =|, 

V2 x V2 = 2 , V^9 = V<TF = ± 3 . 

2 - Une égalité de la forme A = B entre deux 
expressions contenant des combinaisons de nombres 
appartenant à l’ensemble C, ces nombres étant, soit 
écrits sous forme numérique, soit sous forme de 
lettres, peut être : 

— soit toujours vraie, quelles que soient les 
valeurs données aux lettres figurant dans A et B ; on 
l’appellera alors une identité ; 

— soit vraie pour certaines valeurs seulement 
données aux lettres figurant dans A et B ; on l’appel¬ 
lera alors une équation. Par exemple l’égalité 

(a + b) 2 = a 2 + 2 ab + b 2 


Cardan a publié dans son Ars magna (Le grand 
art) la méthode générale de résolution des équa¬ 
tions du troisième degré. 
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LA RESOLUTION DES EQUATIONS 



Le génie mathématique est souvent précoce. Ëvariste Galois (à gauche), refusé au concours d’entrée à l’Ecole Polytechnique en 1830, expulsé de l’Ecole Normale Supérieure en 
1831 pour avoir participé à la lutte menée par les démocrates contre la Monarchie de Juillet, est mort tragiquement, à la suite d’un duel au pistolet, à l’âge de 21 ans, non sans avoir 
écrit, dans la nuit précédant ce duel, une Lettre à Auguste Chevalier qui est un génial testament scientifique, dans lequel il résume ses idées sur la théorie des équations 
algébriques, idées qui sont à la base de l’algèbre moderne. — Niels Henrik Abel (1802-1829), mathématicien norvégien, a montré que les équations algébriques d’un degré supérieur 
à quatre n’avaient pas de solution algébrique générale et a découvert d’importantes propriétés relatives aux fonctions elliptiques et à une classe d’équations appelées équations 

abéliennes. 


est une identité, car on peut donner à a et b n’importe 
quelle valeur sans l’altérer. Par contre, l’égalité 

3x + 7 = 5x+15 

n’est vraie que pour x = — 4 ; pour toute autre valeur de 
x elle n’est plus vérifiée : c’est une équation. L’expres¬ 
sion située à gauche du signe « = » s’appelle le 
premier membre de l’équation, ou membre de gau¬ 
che ; l’expression écrite à droite du signe « = » est le 
deuxième membre de l’équation, ou membre de droite. 

3 - Dans chaque membre figurent un ou plu¬ 
sieurs termes (complexes, ou, dans certains cas parti¬ 
culiers, réels) : 

— Les uns sont des quantités inconnues, que 
l’on demande de calculer compte tenu de l’équation 
proposée. On désigne habituellement ces inconnues 
par les lettres de la fin de l’alphabet : x, y, z par 
exemple. S’il n’existe qu’une inconnue (x), l’équation 
est dite à une inconnue ; s’il y en a deux, il s’agit d’une 
équation à deux inconnues ; s’il y en a n, il s’agit d’une 
équation à n inconnues. 

— Les autres sont des quantités connues ; on 
les appelle des coefficients. Ils peuvent être, soit des 
nombres ( coefficients numériques), soit des lettres 
( coefficients littéraux ou paramètres). Dans le cas des 
coefficients littéraux, la ou les solutions de l’équation 
proposée s’expriment en fonction de ces coefficients. 
Par exemple l’équation 

x 4- m = 3 

a pour solution 

x = 3 - m. 

4 - Résoudre une équation, c’est trouver la 
valeur des inconnues en fonction des quantités 
connues. Pour certains types d’équations, on a établi 
une formule de résolution qui permet de trouver 
rapidement les solutions. Le ou les nombres qui, mis à 


la place de l’inconnue, vérifient l’équation donnée sont 
appelés les racines ou les solutions de l’équation. Par 
exemple, dans l’exemple du scribe, x = — 4 est racine 
de l’équation proposée. 

5-11 peut arriver qu’on ait à résoudre plusieurs 
équations dans lesquelles figurent plusieurs incon¬ 
nues : ces équations forment un système d’équations. 

6 - On appelle degré d’une équation par rapport 
à une inconnue x le plus haut degré de puissance de x 
dans l’équation considérée. L’équation du scribe est 
une équation du premier degré en x. 

7 - Deux équations qui admettent les mêmes 
solutions sont dites équivalentes : on peut remplacer 
l’une par l’autre dans les calculs. 

Résolution d'une équation. 

• Théorèmes généraux. Pour résoudre une 
équation, on fait usage de théorèmes généraux qui 
sont les conséquences de la structure du corps des 
complexes (et, a fortiori, de celui des réels). Si l’on se 
plaçait dans un autre ensemble, par exemple dans un 
espace vectoriel à n dimensions, ou dans l’anneau des 
matrices carrées d’ordre n, etc., ces théorèmes ne 
seraient pas nécessairement vrais. En nous limitant au 
corps des complexes, nous ne traitons que des équa¬ 
tions dites algébriques. Ces théorèmes généraux sont 
connus de tous les écoliers, et nous nous contenterons 
de les résumer en quelques formules. Nous partirons 
d’une équation algébrique A = B. 

1 - A = B <ï> A + C= B + C. (8) 

2 - Corollaire : on peut faire passer un terme 
d’un membre d’une équation dans l’autre à la condition 
de changer son signe. 

3 - A = fî <=> AC = BC, C^O. (9) 


4 - Corollaire : le théorème précédent permet de 
réaliser l’opération qui s’appelle « chasser les 
dénominateurs ». Par exemple l’équation : 

^-1=2x-| (10) 


est équivalente à : 

6x — 2 = 20x-15, (11) 

si l’on multiplie les deux membres de l’équation (10) 
par 10, qui est le PPCM de 5 et de 2. 


5 - [A = B,C =D]z> 


A ±C = B ± D \ 
AC = BD ; 

A_ = _B 
C D ‘ 


( 12 ) 


• Équation du premier degré à une inconnue. 
Sous sa forme entière générale, cette équation s’écrit : 

ax+b = 0. (13) 

— Si a 0, l’équation admet une racine et une 
seule : x = — b/a. 

— Si a = 0 et b ^ 0, l’équation s’écrit 0 x = - b. 
Or il n’existe aucune valeur de xdont le produit par 0 
soit un nombre - b £ 0 ; l’équation (13) n’a donc pas de 
racine : elle est dite impossible. 

— Si a = 0 et b = 0, l’équation s’écrit 0 x = 0, et 
elle est vraie quelle que soit la valeur de x : elle admet 
une infinité de solutions. Elle est dite indéterminée. 

• Équations du n-ième degré, n 4. Sous leur 
forme entière générale, ces équations s’écrivent : 

f ax 2 + bx + c = 0 ; 

< ax 3 + bx 2 + ex 4- d = 0 ; (14) 

( ax 4 + bx 3 4- ex 2 4- dx 4 e = 0 . 

Ce sont, respectivement, les équations du deuxième, 
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LA RÉSOLUTION DES ÉQUATIONS 

troisième et quatrième degré. La méthode générale de 
résolution des équations du deuxième degré a été 
découverte par les mathématiciens de l’ancienne 
Mésopotamie, 2000 ans (et peut-être davantage) avant 
notre ère. La formule de résolution de l’équation du 
troisième degré a été trouvée par les algébristes ita¬ 
liens de la Renaissance qui ont inventé, pour ce faire, 
les nombres imaginaires : Scipione Del Ferro a trouvé 
la solution de l’équation x 3 + px + q= 0 (ce qui est un 
cas particulier de la forme générale ci-dessus), à la 
fin du XV e siècle ; cette solution a été retrouvée par 
Tartaglia en 1535, qui la communiqua à Cardan ; 
celui-ci s’en servit pour établir la formule de résolution 
générale de l’équation du troisième degré (1539). La 
formule générale de résolution de l’équation du qua¬ 
trième degré a été établie par Ferrari, disciple de 
Cardan, en 1555. 

— La résolution de l’équation du second degré 
consiste à factoriser le trinôme ax 2 + bx + c en le 
mettant sous la forme a(x - x-,) (x — x 2 ). Les racines 
(réelles ou complexes) de l’équation sont alors x = x 1 
et x = x 2 , conformément à ce qu’on a expliqué p. 68. 
La formule de résolution donnant x 1 et x 2 est la 
suivante : 


x 1 1 _ -b ± Vfc> 2 — 4 ac 
x 2 j 2 a 


(15) 


La quantité A = b 2 - 4 ac est appelée discriminant 
de l’équation ; elle joue un rôle important dans sa 
discussion, qui se résume aux trois cas suivants lors¬ 
que les coefficients a, b et c sont réels : 

1 - si A > 0, x : et x 2 sont des racines réelles 
distinctes ; 

2 - si A = 0, x 1 et x 2 sont confondus en une 
racine double a - - b/2 a ; 

3 - si A < 0, x^ et x 2 sont deux racines comple¬ 
xes conjuguées de la forme p ± q\. 

— Pour résoudre l’équation du troisième degré, 
on remplace l’inconnue x par l’inconnue auxiliaire 
z = + b/3 a. L’équation générale est alors équivalente 
à l’équation z 3 + pz + q = 0, qui admet, selon les cas, 
trois racines complexes, une racine réelle et deux 
racines complexes, ou trois racines réelles (certaines 
de ces racines pouvant être confondues en racines 
doubles ou triples). 

— La méthode de Ferrari pour résoudre l’équa¬ 
tion du quatrième degré ressemble à la méthode 
employée pour l’équation du deuxième degré : c’est 
une factorisation qui conduit à remplacer l’équation 
donnée par le produit de deux équations du deuxième 
degré en x : 

(Ax 2 + Bx + C) (A' x 2 + B' x + C ') . (16) 

Cette équation a donc quatre racines, réelles ou 
complexes, distinctes ou confondues (deux racines par 
facteur du second degré). 

Le lecteur trouvera le détail des calculs p. 142. 

• Relations entre les coefficients et les racines 
d’une équation. 

— Second degré. On démontre aisément les 
relations x 1 + x 2 = S = — b/a et x A x 2 = P = c/a. La 
connaissance de P et S, calculables à partir des 
coefficients a, b et c de l’équation, permet de prévoir la 
nature des racines, ainsi que leur ordre, sans avoir 
besoin de calculer ces racines elles-mêmes (c’est ce 
qu’on appelle « séparer les racines d’une équation »). 
Par exemple, dans le cas où a, b et c sont réels : 

— si P < 0, cela signifie que les deux racines 
sont de signes contraires, et toutes deux réelles ; 

— si P = 0, cela signifie que l’une des racines 
est nulle, x 1 = 0 ; l’autre racine, x 2 , est donc égale à 
S = - b/a ; 

— si P > 0, cela signifie que les deux racines ont 
même signe si elles sont réelles, ou qu’elles sont 
complexes conjuguées (on tranche entre ces deux cas 
par l’examen du signe de A). 

D’autre part, si l’on connaît le signe du produit P, le 
signe de la somme nous renseignera sur l’ordre de ces 
racines. 

L’étude du signe des racines est facilitée par le 
théorème de Descartes examiné plus loin. 

— D’une façon générale, un polynôme de degré 
n et de coefficients a n , a n _ A , ..., a 0 , pouvant se mettre 
sous la forme : 

a„(* - x,)(x- x 2 )... (x - x„), 

x v x 2 , ..., x n désignant les racines, complexes ou 
réelles, du polynôme, la somme, S, et le produit, P, de 
ces racines sont : 

_ a n —1 

S = Xi + X 2 + "• + X n =-, 


{ a 0 . 

— si n est pair, 

âo . . . 

— —si n est impair. 

On établit aussi que la somme des produits des racines 
prises deux à deux est : 

a n -2 

R = Xi X 2 + X 2 X 3 -+ X, Xi H-+ Xn-1 Xn = - . 

3n 

— Expressions symétriques. Considérons les 
deux expressions A et B fonctions des variables x et y : 

A = x + y et B = xy . 

Il est bien évident que, en vertu de la commutativité des 
opérations fondamentales, ces deux fonctions pren¬ 
nent la même valeur si l’on substitue x à y et y à x. 
D’une manière générale, on appelle fonction symétri¬ 
que entière de p variables un polynôme de ces varia¬ 
bles qui reste identique dans une substitution quelcon¬ 
que sur ces variables. Les fonctions P, S et B définies 
plus haut sont des fonctions symétriques des variables 
x 1f x 2 , ..., x n , c’est-à-dire des racines du polynôme de 
degré n : on appelle ces fonctions les polynômes 
symétriques fondamentaux par rapport à n variables. 
On démontre qu’un polynôme symétrique quelconque 
s’exprime en fonction de P, S, R pour les variables 
considérées. 

L’intérêt des expressions symétriques est de permet¬ 
tre de ramener l’étude d’un polynôme B à celle d’un 
polynôme A plus simple. 

Comment aller plus loin? 

Les mathématiciens cherchèrent tout naturellement 
à résoudre les équations d’un degré supérieur à quatre 
(équations du cinquième degré, du sixième degré, ..., 
du n-ième degré). Cette étude avait un double intérêt : 

— théorique, car il aurait été satisfaisant pour 
l’esprit de trouver une méthode générale de résolution 
pour toutes les équations à une inconnue, quel que soit 
leur degré ; 

— pratique, car les progrès des sciences physi¬ 
ques exigeaient qu’on puisse calculer des quantités 
inconnues figurant dans des expressions de degré 5, 6, 
..., n. 

Il n’est pas question, dans le cadre de ce livre, 
d’examiner en détail les tentatives successives qui ont 
abouti au théorème d’Abel et aux théories de Galois. Il 
nous a cependant semblé fort instructif d’en tracer les 
principales étapes, ce qui permettra au lecteur de 
« boucler la boucle » et de comprendre comment l’on 
est passé de la résolution des équations — thème 
favori de l’algèbre classique — à la théorie des ensem¬ 
bles et à l’algèbre moderne. 

• Les pré'iminaires. Comme les mathématiciens 
ne parvenaient pas à trouver des méthodes générales 
de résolution pour des équations d’un degré supérieur 
à cinq, ils ont tenté de répondre à certaines questions 
préliminaires telles que : 

— combien une équation possède-t-elle de raci¬ 
nes positives ? 

— combien une équation possède-t-elle de raci¬ 
nes réelles ou complexes ? 

— étant donné deux nombres a et /3, combien y 
a-t-il de racines d’une équation donnée qui sont 
comprises entre a et (3 (problème de la séparation des 
racines d’une équation) ? 

— etc. 

De ce point de vue, les deux théorèmes fondamen¬ 
taux, aperçus dès le XVII e siècle, sont le théorème de 
Descartes et le théorème fondamental de l’algèbre 
(Gauss-D’Alembert). 

— Le théorème de Descartes. Ce théorème 
concerne le nombre de racines positives que peut avoir 
une équation de la forme 

P(x) = 0 , 

P(x) étant un polynôme de degré n à coefficients réels. 
Il s’énonce ainsi : 

Dans toute équation algébrique à coefficients réels, 
P(x) = 0, le nombre des racines positives de l’équation 
est au plus égal au nombre des variations de signe du 
premier membre ; lorsque le nombre des racines posi¬ 
tives est différent du nombre des variations de signe du 
premier membre, la différence de ces deux nombres 
est toujours un nombre pair. 

Par variation de signe il faut entendre le fait, pour 
deux coefficients consécutifs, d’être de signes diffé¬ 
rents. Par exemple l’équation : 

3 x 2 - 5 x + 1 = 0, 

présente deux variations de signe, puisque les signes 
de ses coefficients sont « + », « — » et « + ». D’après le 


théorème de Descartes, cette équation doit avoir au 
plus deux racines positives (ici, avec A = 13 > 0 et un 
produit P = x-, x 2 = 1/3 > 0, il y a donc deux racines 
positives). 

De même, l’équation : 

x 5 + x 4 - 3 x 3 - x 2 - 5 x - 1 = 0 

ne présente qu’une seule variation de signe (entre les 
termes + x 4 et - 3 x 3 ) : elle ne peut donc avoir qu’une 
seule racine positive. 

— Le théorème de Gauss-D’Alembert. Nous 
l’avons déjà rencontré ; on l’appelle souvent le théo¬ 
rème fondamental de l’algèbre. En fait, énoncé par 
Girard vers 1625, il n’a reçu qu’une démonstration 
incomplète de la part de D’Alembert (1746). La pre¬ 
mière démonstration complète a été établie par Gauss 
(1799). Par la suite, d’autres démonstrations furent 
donnée^, notamment par Cauchy, Weierstrass, Kro- 
necker. 

Le théorème de Gauss-D’Alembert s’énonce ainsi : 

« Toute équation algébrique de degré n possède au 
moins une racine (complexe ou réelle). » 

On en déduit le corollaire suivant (appelé parfois — à 
tort — théorème de Gauss-D’Alembert) : 

« Toute équation algébrique de degré n a n racines 
(réelles ou complexes) et tout polynôme P(x) se 
décompose d’une seule façon en un produit de fac¬ 
teurs du premier degré. » 

Nous avons vu que ce théorème s’applique, relative¬ 
ment facilement, aux polynômes de degré inférieur ou 
égal à quatre. Pour les polynômes dont le degré est 
supérieur à quatre, le théorème est encore vrai, mais — 
en général — les règles du calcul algébrique sont 
insuffisantes pour en permettre l’application. 

• Le théorème de Rolle. Le Français Michel 
Rolle (1652-1749) a cherché à résoudre les équations 
par un procédé appelé « méthode des cascades ». Le 
théorème qui porte son nom concerne les racines 
réelles d’une équation P(x) = 0 à coefficients réels 
(Rolle appartenait aux générations de mathématiciens 
effrayés par les nombres « imaginaires »). Supposons 
qu’une équation P(x) = 0 ait plusieurs racines réelles, 
qu’on écrira, par ordre croissant : 

Xi, x 2 , x 3 ,..., 

et considérons deux racines consécutives, par exem¬ 
ple x 2 et x 3 . Le théorème de Rolle consiste à dire qu’il 
existe, entre x 2 et x 3 , un nombre impair (1, 3, 5, ...) de 
racines de l’équation dérivée : 

P(x) = 0. 

Nous n’avons pas encore défini, ici, la notion de 
dérivée : c’est en effet une notion qui est du domaine 
de \’analyse et non pas de l 'algèbre. Pour ceux de nos 
lecteurs qui l’ignorent, disons brièvement qu’on peut 
calculer, à partir d’un polynôme P(x), un autre poly¬ 
nôme appelé polynôme dérivé, noté P'(x), par des 
procédés simples de calcul (voir p. 114). 

Supposons qu’on ait à résoudre une équation 
P(x) = 0 et qu’on sache résoudre P'(x) = 0 ; soit x/ x 2 , 
pour fixer les idées, les racines réelles de P'(x) = 0 ; 
nous sommes certains que deux racines réelles consé¬ 
cutives de P(x) = 0, x 2 et x 3 par exemple, ne peuvent 
pas encadrer x; et x' 2 , puisqu’il ne peut y avoir qu’un 


Charles Sturm (1803- 
1855) : mathématicien 
français d’origine 
suisse, auteur de la 
démonstration du 
théorème qui porte son 
nom, et qui permet de 
déterminer le nombre 
des racines réelles 
d’une équation 
algébrique, comprises 
entre deux limites 
données. 
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nombre impair de racines de P'(x) = 0 entre x 2 et x 3 . 
Ainsi donc on devra avoir: 

— soit l’ordre croissant 

x\ x 2 x 2 x 3 ; 

— soit l’ordre croissant 

x 2 x\ x 3 x 2 x 4 . 

Autrement dit, il existe une seule racine réelle de 
P(x) qui ait une valeur comprise entre x\ et x 2 . 

• Le théorème de Sturm. En fait, le théorème de 
Rolle est très utile, car on peut encadrer x 2 entre x' et 
x 2 , puis encadrer x\ et x’ 2 par les racines du polynôme 
dérivé de P'(x), et ainsi de suite : tel est le principe de la 
méthode en cascade, qui cerne, de plus en plus, la 
racine x 2 , comme un tireur approche de plus en plus de 
sa cible en tirant un coup au-delà, un coup en deçà, et 
ainsi de suite. Mais la méthode de Rolle n’est possible 
que si l’on sait résoudre P'(x) = 0. Sinon, pour fixer le 
nombre de racines réelles d’une équation et les sépa¬ 
rer, il faut faire appel à un théorème un peu plus 
compliqué appelé théorème de Sturm (mathématicien 
français, d’origine suisse), exposé en 1829, par son 
auteur dans son Mémoire sur la résolution des équa¬ 
tions numériques. La méthode consiste à associer à 
une équation P(x) = 0 de degré n une suite de fonc¬ 
tions appelées fonctions de Sturm de degrés décrois¬ 
sants de n à 0 et à étudier les signes pris par ces 
fonctions pour deux valeurs particulières, «et /3, de la 
variable x. Si la suite présente, pour x= a, p variations 
de signe, et pourx= (3 ((3> a), q variations de signe, 
Sturm démontre qu’il existe alors p— graciées réelles 
de P(x) = 0 comprises entre a et (3. 

• Le théorème d’Abel. A vrai dire, on se doutait 
bien, au début du XIX e siècle, que les équations géné¬ 
rales de degré supérieur à quatre étaient impossibles à 
résoudre par les seuls moyens du calcul algébrique. Un 
médecin italien de Bologne, Paolo Ruffini (1765-1822), 
avait tenté de le montrer, en 1798, dans sa Théorie 
générale des équations ; mais sa démonstration était 
incomplète. C’est alors que le jeune mathématicien 
norvégien Abel (1802-1829) découvrit le théorème qui 
porte son nom (en 1824 ; il était âgé de 22 ans). 

Qu’est-ce que résoudre algébriquement une équa¬ 
tion algébrique de degré n ? se demande Abel. C’est 
exprimer ses racines, x 1f x 2 , x 3 , ..., x n , en fonction de 
ses coefficients a n , a n _ : , ..., a 0 , ces fonctions ne 
comportant que des opérations algébriques sur ces 
coefficients, c’est-à-dire les opérations définissant la 
structure du corps, C, des complexes. Or ces opéra¬ 
tions et les opérations qui en découlent sont au 
nombre de six : 

— l’addition et son opposée, la soustraction (qui 
est une addition déguisée) ; 

— la multiplication et l’élévation à une puis¬ 
sance entière m (qui est une multiplication m fois 
répétée) ; 

— la division, qui se réduit à la multiplication 
par un inverse ; 

— l’extraction de racines. 

Cette dernière opération, de beaucoup la plus diffi¬ 
cile à réaliser techniquement, impose l’usage des 
radicaux, c’est-à-dire du signe V - 

Nous avons vu que les équations de degré inférieur 
ou égal à quatre admettent, dans le cas le plus général, 
1, 2, 3 ou 4 racines, selon leur degré; ces racines, 
réelles ou complexes, sont calculables uniquement à 
l’aide des opérations précédentes, c’est-à-dire qu’on 
peut les exprimer notamment en utilisant deux radi¬ 
caux : y /~et qui se lisent respectivement «racine 
carrée de », et « racine cubique de ». Soit maintenant 
une équation de degré n, par exemple du cinquième 
degré, pour fixer les idées ; elle admet (théorème de 
Gauss-D’Alembert) cinq racines (que nous ne savons 
pas calculer dans le cas général) : 

X 1( * 2 , X 3 , * 4 , X 5 . 

Abel a démontré que, si l’on pouvait exprimer ces 
racines par des radicaux cubiques ^(comme dans la 
formule de Cardan pour une équation du troisième 
degré), ces radicaux devraient être équivalents à des 
fonctions rationnelles (c’est-à-dire ne faisant intervenir 
aucun radical) des racines, de la forme 

<p(Xi,x 2 , x 3 , x 4 , x 5 ), 

dont l’expression explicite importe peu ici, mais qui 
doivent avoir la propriété suivante : si l’on opère une 
permutation circulaire de trois lettres seulement, ces 
fonctions restent invariables. 

Une permutation circulaire entre trois lettres, x 2 , x 3 
et x 4 par exemple, se réalise en plaçant ces trois lettres 
aux sommets d’un triangle et en les lisant en tournant 


LE THEOREME D'ABEL ET LA THEORIE DE GALOIS 


Fragment manuscrit de Galois (folio 3b), 
extrait du Mémoire sur les conditions de 
résolubilité des équations par radicaux. 
Ce fameux premier mémoire, datant de 
1830, a été écrit sur trois feuilles doubles 
de format 25 x 38 cm, réunies et cousues 
en un livret de six feuillets, soit 12 pages, 
dont la première porte le titre et l’avertis¬ 
sement et dont la dernière est blanche. Le 
texte du mémoire est à droite ; à gauche, 
dans la marge, E. Galois a introduit des 
notes, additions et corrections. 



toujours dans le même sens à partir de l’une d’elles : 



x 2 < x 4 


Par exemple : 

— en partant de x 2 on a la permutation : 

x 2 x 3 x 4 ; 

— en partant de x 3 on a la permutation : 

x 3 x 4 x 2 ; 

— en partant de x 4 on a la permutation : x 4 x 2 x 3 . 
On devrait donc avoir, par exemple, en encadrant les 

racines sur lesquelles on envisage une permutation 
circulaire : 





X 5 ) = <P(>Cl, 



Abel a aussi montré que le même raisonnement 
s’applique à un radical cinquième, ^/~, si l’on considère 
une permutation circulaire de cinq racines, etc., et à un 
radical d’indice p = un nombre premier, pour une 
permutation circulaire portant sur p racines. 

Or, et cela nous conduit à l’énoncé du théorème 
d’Abel, si x l5 x 2 , ... sont des fonctions algébriques des 
coefficients, on peut montrer que les fonctions <p ne 
restent pas invariables quand on opère sur ces racines 
des permutations circulaires dans les conditions qui 
viennent d’être énoncées. 

Conclusion : il n’y a pas de fonctions <p qui respec¬ 
tent ces conditions d’invariabilité, c’est-à-dire qu’il n’y 
a pas de radicaux susceptibles d’exprimer x 1f x 2 , ... 
D’où le théorème d’Abel : 

« Il est impossible de résoudre algébriquement les 
équations générales d’un degré supérieur à quatre. » 
Ce théorème — dont la démonstration fut améliorée, 
ultérieurement, par Wantzel (1845) — tire en principe 
un trait sous l’algèbre classique, considérée comme 
l’art de résoudre des équations. 

• Un nouveau point de départ. Faut-il donc 
refermer tous les livres d’algèbre, effacer les tableaux 
noirs et se diriger vers d’autres domaines mathémati¬ 
ques, comme l’analyse par exemple ? Certes non, car, 
si l’on considère, au lieu des équations générales de 
degré n, des équations particulières, on constate 
aisément que certaines d’entre elles sont résolubles. Il 
est donc utile, étant donné une équation, de pouvoir 
reconnaître a priori, par l’examen de certains de ses 
caractères, si elle est résoluble ou non par radicaux. 
Or, bien avant que le théorème d’Abel n’eût été démon¬ 
tré, Lagrange avait proposé une méthode d’approche 
des équations générales, fondée sur la recherche 


d’une équation secondaire (résolvante) conduisant à la 
résolution de l’équation proposée. Cette méthode a 
comme point de départ la théorie des substitutions, 
opérations par lesquelles on passe, par exemple, d’une 
suite (x 1P x 2 , x 3 ) à une suite (x 2 , x 3 , x n ) ; ce n’est pas le 
lieu ici de l’expliquer, mais il apparaissait à Lagrange 
qu’une équation est résoluble algébriquement si cer¬ 
taines substitutions entre ses racines sont possibles 
sous certaines conditions données. On a vu, d’ailleurs, 
que le théorème d’Abel fait usage de cette théorie des 
substitutions. 

C’est à Galois (1811-1832) que devait revenir le 
mérite de la solution générale du problème. Celui-ci 
posa la question en ces termes : « Chercher, pour 
chaque équation, un ensemble de substitutions relatif 
à ses racines et qui soit en rapport : 1° avec la nature 
intime de l’équation ; 2° avec le fait qu’elle est ou non 
résoluble par d’autres équations secondaires. » 

Ainsi la théorie des équations algébriques débou¬ 
che-t-elle, avec les travaux de Galois, sur la théorie des 
groupes de substitutions dont nous avons indiqué 
quelques aspects p. 24 et qui devait être approfondie, 
au XIX e siècle, par Gauss, Cauchy, Serret, Kronecker, 
Bertrand, Hermite, puis par Jordan. Il devait s’en 
dégager peu à peu l’idée que la structure d’un 
ensemble (de coefficients, de racines, de polynômes, 
de nombres, ... ou de n’importe quels éléments) était 
plus importante à connaître (donc à définir) que les 
éléments de cet ensemble. 

Or on parvenait, à peu près à la même époque 
(c’est-à-dire entre 1850 et 1870), aux mêmes conclu¬ 
sions en ce qui concerne d’autres domaines mathéma¬ 
tiques : 

— à propos de la définition générale des 
« nombres » et des opérations qu’on peut faire sur des 
éléments autres que des réels ou des complexes ; 

— à propos des opérations effectuées sur les 
figures géométriques et qu’on appelle des transforma¬ 
tions ; 

— à propos des relations qui existent entre 
certains axiomes (comme l’axiome des parallèles dit 
« axiome d’Euclide ») et un groupe particulier de trans¬ 
formations : invention par Lobaôevskij (1829), Bolyaï 
(1833) et Riemann (1854) des géométries non eucli¬ 
diennes ; 

— à propos de maints problèmes d’analyse res¬ 
tés jusqu’alors en suspens. 

Toutes ces questions devaient être groupées en un 
corps de doctrines cohérent, dominé par la théorie des 
ensembles (élaborée par Cantor entre 1872 et 1895), et 
former l 'algèbre moderne, dont le premier exposé 
synthétique fut proposé en 1910 par Steinitz. 
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W. Kandinsky (1866-1944), l’un des créateurs de l’art abstrait, s’est librement inspiré, à partir de 1920, de la géométrie. Ci-dessus : Pointes en arc (1927). 
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GEOMETRIE 


QU'EST-CE QUE LA GÉOMÉTRIE? 

La géométrie et les géométries. 

Le point de départ. 

La géométrie a d’abord été la science de la mesure 
des étendues (du grec gë = « terre » ; metron = 
« mesure »). Ce que les premiers géomètres — égyp¬ 
tiens, mésopotamiens, grecs — ont cherché à mesurer, 
c’est l’étendue d’une ligne (sa longueur), droite ou 
courbe, l’étendue d’une surface (son aire) limitée par 
des lignes, l’étendue d’une partie de l’espace à trois 
dimensions (son volume). 

A partir du VI e siècle av. J.-C., dans les colonies 
grecques d’Ionie, des personnages, historiques ou 
semi-légendaires, comme Thalès ou Pythagore, et 
leurs disciples immédiats ont transformé ces techni¬ 
ques d’arpentage en une discipline « libérale >> comme 
le dit dans un texte célèbre Proclus, qui fut, au 
V e siècle de notre ère, le premier historien des mathé¬ 
matiques (voir p. 1) : 

«... [Après Thalès et ses successeurs immédiats] 
Pythagore transforma cette étude [= la géométrie] et 
en fit un enseignement libéral car il remonta aux 
principes supérieurs et rechercha les théorèmes abs¬ 
traitement et par l’intelligence pure... ). 

Il faut interpréter « libéral » comme « libéré des 
préoccupations utilitaires », à savoir celles de l’arpen¬ 
teur ou de l’architecte. De fait, ce sont les membres des 
sectes pythagoriciennes, répandues à travers le monde 
grec ancien, depuis les îles de l’Asie-mineure jusqu’à la 
Sicile, qui ont remplacé l’idée pratique de mesure par 
l’idée plus générale de relation. De sorte que la 
première théorie géométrique de l’histoire s’est pré¬ 
sentée comme l’étude abstraite, à l’aide du seul raison¬ 
nement, des relations de position et des relations 
métriques. Exemples de relations de position : la droi¬ 
te D est parallèle à fa droite D' ; la droite D est 
perpendiculaire à la droite D' ; la droite Dest tangente 
au cercle C ; les courbes Cet C' se coupent en un point 
M ; etc. Exemples de relations métriques : le segment 
AB est triple du segment AC ; le triangle ABC est égal 
(= superposable sans déformation) au triangle 
A' B' C ' ; l’aire du cercle de rayon R est égale à irR 2 ; le 
carré de l’hypoténuse d’un triangle rectangle est égal à 
la somme des carrés des côtés de l’angle droit ; etc. 

Les méthodes. 

Pour établir les relations de position et les relations 
métriques qui existent entre des figures que nous 
nommons pour l’instant : points, lignes, surfaces, volu¬ 
mes, sans trop nous interroger sur leur définition, les 
mathématiciens ont fait appel à des méthodes très 
diverses. L’invention de ces méthodes est en général 
l’œuvre d’un savant (ou d’une École) cherchant à 
résoudre un problème laissé en suspens par les métho¬ 
des en usage à un instant donné ; puis de nouvelles 
méthodes se révèlent un instrument puissant, applica¬ 
ble à d’autres problèmes que celui ou ceux pour 
lesquels elles ont été inventées. Il en résulte alors une 
nouvelle géométrie, à propos de laquelle d’autres 
problèmes se présentent, et ainsi de suite. De ce point 
de vue, l’histoire de la géométrie est bien différente de 
celle de l’algèbre. Cette dernière est, nous l’avons vu, 
une généralisation progressive de la théorie des nom¬ 
bres : elle se déroule selon une ligne bien régulière, et 
ne connaît que peu d’arborisations. Au contraire, 
l’histoire de la géométrie est comparable à ces fusées 
qui s’élancent dans les airs, qui éclatent en une gerbe 
d’étincelles, et dont chaque étincelle explose à son 
tour et ainsi de suite. L’évolution de la géométrie est 
analogue à celle d’un végétal dont les arborisations se 
multiplieraient indéfiniment. 

• La méthode expérimentale. Ce fut la méthode 
des géomètres-arpenteurs antérieurs aux pythagori¬ 
ciens. Nous la citons ici pour mémoire. Avec la règle, le 
compas et les instruments qui en dérivent (équerre, 
rapporteur), on peut étudier les figures géométriques 
expérimentalement. En mesurant à l’aide d’un rappor¬ 
teur les angles d’un triangle dessinés sur une feuille de 
papier, on constate que leur somme est égale à 180°, 
aux erreurs de mesure près. En traçant deux perpendi¬ 


culaires à une même ligne droite sur le sable et en 
prolongeant ces perpendiculaires sur plusieurs dizai¬ 
nes de mètres, on constate qu’elles ne se coupent pas. 
Ce sont là des observations banales, sur lesquelles on 
peut se fonder pour dire : la somme des angles d’un 
triangle est égale à 180°, deux perpendiculaires à une 
même droite sont parallèles. Mais le savoir ainsi 
énoncé n’est pas certain : il n’est que probable, et nous 
n’avons aucune raison de penser que les propriétés 
énoncées sont vraies dans tous les cas possibles. 

• La méthode hypothético-déductive est la 
méthode géométrique classique, mise au point par les 
anciens Grecs et qui atteint à une sorte de perfection 
dans les Éléments rédigés par Euclide, professeur de 
mathématiques au Musée d’Alexandrie, vers 300 av. 
J.-C. 

La méthode démonstrative euclidienne est bien 
connue de tous les écoliers : à partir d’un ensemble de 
propositions considérées comme fondamentales, on 
peut, par le pur jeu du raisonnement, démontrer de 
proche en proche des propositions appelées théorè¬ 
mes, en respectant les règles de la logique formelle, à 
savoir principalement que deux propositions contra¬ 
dictoires ne peuvent être vraies ou fausses en même 
temps (principe dit de non-contradiction , entraînant 
l’exclusion d’une troisième proposition possible). Les 
propositions dont on part sont appelées des hypothè¬ 
ses, celles auxquelles on parvient par la déduction 
sont des conclusions. 

Le contenu des Éléments d’Euclide peut se résumer 
comme suit. 

1 - L’œuvre comprend treize Livres, à travers 
lesquels sont réparties diverses propositions concer¬ 
nant la géométrie plane (ligne droite, triangles, polygo¬ 
nes, cercle), la géométrie dans l’espace et la théorie 
des nombres. 

2 - Chaque Livre commence par des définitions, 
d’où l’on tire, par combinaison avec d’autres défini¬ 
tions préalablement données et avec des propositions 
antérieurement démontrées, de nouvelles proposi¬ 
tions. 

3 - Le Livre I contient, outre les définitions 
relatives aux objets les plus généraux de la géométrie 
(point, ligne, surface, plan, angles, cercle, polygone, 
droites parallèles) six « demandes » — ou « postulats » 
— parmi lesquelles la proposition connue sous le nom 
de « postulat d’Euclide » sur laquelle nous reviendrons 
plus loin, et neuf « notions communes » concernant 
l’égalité et l’inégalité des grandeurs et l’axiome que 
« le tout est plus grand que la partie ». 

• La méthode analytique a été inventée au 
XVII e siècle par Fermât et par Descartes (1637). Elle 
consiste principalement à traduire une réalité géomé¬ 
trique par des nombres réels ou par des relations entre 
ces nombres. 

— L’idée fondamentale a été l’introduction des 
coordonnées d’un point (voir p. 95). Au XVII e siècle, 
ce n’était pas une idée neuve, car elle avait déjà été 
utilisée vers 1350 par Nicole Oresme, évêque de 
Lisieux, mathématicien et astronome d’une grande 
originalité. Toutefois cette notion n’avait été ni retenue, 
ni exploitée par les mathématiciens de la Renaissance. 

— Un point du plan est donc défini par deux 
nombres (x, y) qui sont ses coordonnées, un point de 
l’espace à trois dimensions est représenté par trois 
nombres (x, y, z) qui sont ses coordonnées spatiales. 
Une courbe algébrique est un ensemble de points dont 
les coordonnées vérifient une relation de la forme 
f(x, y) = o ou f(x, y, z) = 0, selon que l’on se place 
dans le plan ou dans l’espace, et qu’on appelle équa¬ 
tion de la courbe. Une propriété telle que « les cour¬ 
bes C et C' se coupent en un point M » se traduit en 
géométrie analytique par : « les équations f(x, y) = Oet 
g(x, y) = 0 ont une solution commune (x 0 , y 0 ), coor¬ 
données du point M ». 

La création de la géométrie analytique a été rendue 
nécessaire par les nombreuses imperfections de la 
géométrie traditionnelle, imperfections que jusqu’alors 
les mathématiciens n’avaient pu surmonter. 

1 - En effet la géométrie euclidienne n’est pas 
une géométrie générale, en ce sens qu’elle exige, pour 
chaque cas de figure, une nouvelle démonstration. 
Pour démontrer, par exemple, qu’une droite est paral¬ 
lèle à une autre, il faut faire de longs raisonnements en 
combinant les données du problème, et, très souvent, 


« avoir l’idée » d’une construction permettant de faire 
progresser la démonstration, etc. 

2 - Dès que le problème devient un peu compli¬ 
qué (par exemple si l’on considère des courbes aux 
formes non usuelles et construites autrement qu’à 
l’aide de la règle et du compas), la géométrie pure 
devient rapidement impuissante et, depuis Euclide, on 
ne comptait plus les questions posées et auxquelles il 
n’avait pas été donné de réponse. 

3 - En particulier, la géométrie euclidienne clas¬ 
sique ne propose aucune méthode générale pour 
résoudre les problèmes de « lieux géométriques », 
c’est-à-dire de la détermination d’une courbe dont tous 
les points doivent satisfaire à une condition nécessaire 
et suffisante donnée. 

Or l’algèbre, avec ses symboles et ses mécanismes 
de calcul perfectionnés, tels qu’on les connaissait 
enfin au début du XVII e siècle, passionnait alors les 
esprits. C’est pourquoi Fermât et Descartes eurent 
l’idée de traduire en langage algébrique (c’est-à-dire 
en équations) les problèmes de géométrie et de profi¬ 
ter ainsi des automatismes algébriques. 

Toutefois, jusqu’à la fin du XVII e siècle, l’invention de 
Descartes se limita à être « l’application de l’algèbre à 
la géométrie », c’est-à-dire qu’elle n’ouvrit pas de 
nouveaux domaines aux recherches des mathémati¬ 
ciens. Dans le courant du XVIII e siècle, les mathémati¬ 
ciens ont perfectionné la méthode cartésienne et leurs 
travaux ont été à l’origine de la géométrie analytique 
moderne. En quoi consistaient ces perfectionne¬ 
ments ? Principalement en ceci : 

1 - extension de la géométrie analytique plane 
de Descartes à l’espace (c’est-à-dire à l’étude de 
systèmes de coordonnées à trois dimensions) ; 

2 - étude systématique des courbes planes algé¬ 
briques. 

En effet, jusqu’à la fin du XVII e siècle, la géométrie 
analytique ne sert guère qu’à l’étude de la droite, du 
cercle, et des coniques (ellipse, parabole, hyperbole). 
C’est Newton qui fit franchir le pas à la géométrie 


L’arpentage, l’art de mesurer la superficie des 
terres, n’a que de très lointains rapports avec la 
géométrie, arf de raisonner sur des notions abstrai¬ 
tes, définies par des axiomes. Ci-dessous : extrait 
du Traité d’arpentage d’Arnaud de Villeneuve (XV e 
siècle). 
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analytique en utilisant ces méthodes pour étudier les 
courbes du troisième degré (cubiques) ; ses succes¬ 
seurs entreprirent l’étude analytique des courbes de 
degré supérieur, et l’œuvre la plus marquante du 
XVIII e siècle, en l’espèce, est sans doute \’Introduction 
à l’analyse des lignes courbes algébriques, publiée à 
Genève, en 1750, par Cramer, dont nous avons déjà 
rencontré le nom à propos de la théorie algébrique des 
déterminants (voir p. 58). Le perfectionnement des 
méthodes analytiques est dû principalement à Lagran¬ 
ge, qui parvint à simplifier les calculs et à améliorer les 
notations, et à Monge, dont les cours à l’École 
Polytechnique, en 1795, sont le premier exposé d’en¬ 
semble de la géométrie analytique moderne. 

• La méthode infinitésimale et différentielle est 
une approche différente des problèmes géométriques. 
Elle est née à la fin du XVIII e siècle, lorsque Monge, 
après Euler, cherche à étudier les propriétés des 
courbes qui ne peuvent être abordées par la simple 
étude algébrique. Ces propriétés concernent essentiel¬ 
lement la notion de courbure (des lignes et des surfa¬ 
ces), et des problèmes relatifs aux tangentes, aux 
normales, aux sous-tangentes à une courbe. 

Pour résoudre les questions qui se posent en ce 
domaine, il est nécessaire de faire intervenir un outil 
nouveau, différent de l’algèbre classique : le calcul 
différentiel et intégral et l’analyse, qui ont été les deux 
grandes théories mathématiques élaborées au cours 
du XVIII e siècle, depuis les travaux de Leibniz et de 
Newton. 

• La méthode projective, née avec les travaux 
de Poncelet (1812-1814) et Steiner (1832), utilise à la 
fois les méthodes de la géométrie pure, de la géométrie 
analytique et de la géométrie différentielle. Elle 
consiste essentiellement à se demander ce que devien¬ 
nent les propriétés d’une figure lorsqu’on transforme 
celle-ci selon des règles bien déterminées. Nous en 
expliquerons les principaux aspects ci-après (p. 87), 
mais il nous faut noter ici que la fécondité de cette 
méthode a été double. 

1 - D’une part, elle a fait apparaître des proprié¬ 
tés nouvelles des figures, et a donné l’occasion aux 
méthodes analytique et différentielle de se développer 
pour s’adapter à l’étude de ces propriétés (au terme de 
cette évolution se situe la géométrie considérée 
comme une combinatoire abstraite : la géométrie algé¬ 
brique). 

2 - D’autre part, elle a attiré l’attention des 
mathématiciens sur le fait qu’il n’y a pas une géométrie 
(par exemple la géométrie d’Euclide, augmentée de 
toutes les propositions découvertes grâce à la géomé¬ 
trie analytique, à la géométrie infinitésimale et à la 
géométrie différentielle), mais des géométries. 

Ce sont ces géométries que Félix Klein a classées 
dans son célèbre Programme d’Erlangen (1872), en se 
fondant sur la théorie des groupes, qui remonte, 
comme on l’a dit p. 73, aux travaux de Galois (1830). 


Définition de la géométrie. 

• Notion de transformation. Considérons une 
courbe C dans l’espace « ordinaire » à trois dimen¬ 
sions comme une figure formée d’un ensemble de 
points M (nous admettrons que les notions de 
« point » ou de « figure » sont intuitives). Convenons 
de définir une transformation 7 comme l’opération qui 
remplace un point M de l’espace par un point M' du 
même espace, selon des règles bien déterminées. En 
appliquant cette transformation à tous les points M de 
C, on obtient une courbe C', constituée par tous les 
points M' déduits des points M, qui est la transformée 
de C par T. Nous pouvons écrire, géométriquement : 

f M -1 M' ; 

} (1) 

1 c-Uc. 

On peut aussi écrire analytiquement, en appelant 
(x, y, z) les coordonnées du point M et f(x, y, z) = 0 
l’équation de la courbe C : 

(x, y, z)-L* (X y', z') ; 
f(x, y, z) = 0 ' > g(x\ y', z') = 0 . 1 ' 

Nous pouvons étudier les propriétés de la courbe C' 
par les moyens de la géométrie pure, mais il est plus 
commode, en général, d’aborder le problème analyti¬ 
quement en étudiant l’équation g(x\ y', z') = 0. On 
peut aussi aborder, grâce au calcul différentiel et 
intégral, les problèmes relatifs à la courbure et aux 
tangentes de la courbe C'. 

En comparant les courbes C et C', on observera que 
certaines propriétés sont conservées au cours de la 
transformation T (peu importe lesquelles pour l’ins¬ 


tant) : on les nomme, pour cette raison, des propriétés 
invariantes et les formes mathématiques qui les tradui¬ 
sent (équations, formes algébriques, fonctions, etc.) 
sont les invariants de la transformation. 

• L ’ensemble V de toutes les transformations T 
possède une structure qui dépend, évidemment, de la 
nature de cette transformation. Appelons produit de 
deux transformations T 1 et T 2 la transformation obte¬ 
nue en faisant subir à une figure F la transformation 7 1 
puis la transformation T 2 . Nous désignerons ce produit 
par le signe « J_ », comme nous l’avons fait en théorie 
des ensembles et en algèbre des structures : le produit 
de deux transformations est une loi de composition sur 
l’ensemble £ des transformations telles que T. Suppo¬ 
sons maintenant que l’on puisse démontrer les propo¬ 
sitions suivantes. 

1 - Le produit de deux transformations T 1 et T 2 
appartenant à T> est une troisième transformation 
T 3 G (autrement dit : l’opération « produit » est une 
loi de composition interne, au sens défini en algèbre 
des structures, p. 37). 

2 - Ce produit est associatif, c’est-à-dire que 
quelles que soient 7 \, T 2 , T 3 appartenant à l’ensemble 

T»’, on a : 

(T, J- T 2 )± T 3 =T,±(T 2 ±T 3 ). (3) 

3-11 existe une transformation T 0 , appelée 
transformation identique, telle que : 

T 0 _L T= TA. T 0 = 7. (4) 

Autrement dit : T 0 est l 'élément neutre pour la loi de 
composition interne « _L ». 

4 - A chaque transformation 7 appartenant à 
l’ensemble K on peut faire correspondre une transfor¬ 
mation appartenant au même ensemble, notée T \ 
telle que : 

71 T 1 = T 'JL T= T 0 . (5) 

Autrement dit : toute transformation 7 possède une 
inverse 7 -1 dans l’ensemble 6. 

Ces quatre propriétés sont celles qui caractérisent 
un ensemble à structure de groupe (voir 
p. 40). Si elles sont vérifiées, nous dirons donc que les 
transformations 7constituent un groupe de transforma¬ 
tions G. 

• Définition générale d’une géométrie. Ne 
parlons plus de points ni de figures, car ces notions 
intuitives n’ont pas encore été définies. Contentons- 
nous d’appeler éléments les objets d’un ensemble que 
nous nous proposons d’étudier. On appelle géométrie 
de groupe fondamental G l’étude des propriétés des 
éléments d’un ensemble qui restent invariantes pour 
un groupe de transformations G. 

Les géométries. 

Les êtres géométriques sur lesquels nous raison¬ 
nons géométriquement peuvent être définis par des 
axiomes (voir ci-après p. 78). Nous admettrons ici que 
leur ensemble possède la structure d 'espace vectoriel 
sur un corps K, à n dimensions. Le cas le plus simple 
est celui où il s’agit d’un espace vectoriel à deux 
dimensions sur le corps (R des réels, à savoir l’espace 
IR 2 . Nous avons expliqué, p. 48, que cet espace 
(= ensemble) n’était autre que le plan à deux dimen¬ 
sions de la géométrie euclidienne classique : chaque 
point du plan est défini par un vecteur à deux 
composantes (x, y), le mot « vecteur » étant pris en 
son sens général (p. 47). Les figures de IR 2 sont les 
figures planes. On peut les étudier par le raisonne¬ 
ment géométrique pur ou par le calcul (géométrie 
analytique). Un exemple un peu plus compliqué est 
celui de l’espace à trois dimensions sur (R. C’est 
l’ensemble des points de l’espace « ordinaire », 
chaque point étant un vecteur à trois composantes (x, 
y, z) ; les figures dans IR 3 sont des figures planes (cas 
particulier) ou des figures gauches et des solides 
(cube, sphère, etc.). On peut les étudier soit par le 
raisonnement géométrique, soit par des méthodes 
analytiques. 

Rien ne nous interdit d’aller plus loin, et d’étudier les 
propriétés d’un espace vectoriel à n dimensions IR n . 
Chaque « point » de cet espace est un ensemble de n 
nombres réels (x 1? x 2 , ..., x n ), dont on ne peut plus 
donner une image physique (alors qu’un point dans IR 2 
ou dans IR 3 peut être « dessiné »). Les propriétés des 
figures n-dimensionnelles peuvent être étudiées par le 
calcul ou par le raisonnement géométrique, mais ce 
dernier est plus délicat à manier que le premier. 

Bien entendu, rien ne nous empêche de considérer 
un espace vectoriel à n dimensions sur un corps autre 
que (R, c’est-à-dire des vecteurs dont les composantes 
sont des nombres complexes ou hypercomplexes 
(géométries complexe, hermitienne, quaternionienne, 



etc.). Il est à peine besoin de souligner que c’est ici le 
calcul et la combinatoire qui l’emportent sur le raison¬ 
nement géométrique. 

Cela dit, quel que soit l’espace dans lequel nous 
nous plaçons, la géométrie de cet espace est définie 
par le groupe fondamental de transformations G qui 
laisse invariantes certaines propriétés des figures. D’où 
une classification des géométries, proposée par Félix 
Klein en 1872. 

• La géométrie projective étudie les propriétés 
qui sont conservées dans une transformation apparte¬ 
nant au groupe projectif. Les transformations de ce 
groupe peuvent être définies comme faisant corres¬ 
pondre à des points alignés A, B, C, ... des points A’, 
B', C', ... qui sont eux aussi alignés. Le groupe projectif 
conserve la colinéarité. 

La notion de « points alignés » est intuitive pour les 
points du plan IR 2 ou de l’espace (R 3 . Dans l’espace 
n-dimensionnel K n , la notion d’alignement se définit 
par des relations entre les composantes des vecteurs 
(= des points) alignés. 

• La géométrie affine étudie les propriétés qui 
sont conservées dans tout changement de repère (le 
système de coordonnées), c’est-à-dire dans toute 
transformation linéaire des coordonnées. On peut 
montrer que le groupe des transformations affines est 
un sous-groupe du groupe projectif ; les propriétés 
invariantes pour les transformations de ce 
sous-groupe sont des propriétés affines. Les transfor¬ 
mations affines sont aussi appelées dilatations quand 
elles ont lieu dans le plan IR 2 ou dans le plan R 3 (ce sont 
des translations, des symétries et des homothéties). 

En géométrie plane, les transformations affines lais¬ 
sent invariante une droite, dite droite à l’infini (c’est la 
droite privilégiée composée des points de rencontre de 
toutes les droites parallèles deux à deux dans le plan, 
en admettant que des droites parallèles se coupent à 
l’infini) ; cette droite privilégiée n’existe pas en géomé¬ 
trie projective. En géométrie dans l’espace, les trans¬ 
formations affines laissent invariant un plan dit plan à 
l’infini, qui n’existe pas en géométrie projective à trois 
dimensions. Dans un espace à n dimensions, les 
transformations affines laissent invariant un ensemble 
de points — c’est-à-dire un espace — à (n - 1) dimen¬ 
sions. 

Analytiquement, une transformation affine est défi¬ 
nie par un système d’équations linéaires. Ainsi dans 
U 2 , un point (x, y) devient un point (x', y') tel que : 
x' = ax + by + c, 
y' = a' x + b' y + c ', * c> ' 

avec ab' - ba' 0 . 

Une transformation telle que (6) correspond à un 
changement de base dans l’espace vectoriel (R 2 : les 
propriétés affines d’une figure sont donc celles qui 
sont indépendantes du choix du système de coordon¬ 
nées. Par exemple, le fait qu’un point M soit le milieu 
d’un segment AB est une propriété affine, car elle est 
vraie dans tout système de coordonnées. 

• La géométrie métrique est l’étude des pro¬ 
priétés conservées par les transformations du groupe 
des déplacements, à savoir la conservation des lon¬ 
gueurs et des angles. 

• Géométrie euclidienne et géométrie non 
euclidienne. La géométrie euclidienne affine est une 


Nikolaj Ivanoviù 
Lobaôevskij (1792- 
1856) : mathématicien 
russe qui construisit 
une géométrie rigou¬ 
reuse en prenant un 
autre postulat que 
celui d’Euclide : « Par 
tout point hors d’une 
droite, on peut mener 
deux parallèles à cette 
droite. » 
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géométrie particulière, dont le groupe de transforma¬ 
tions est celui des similitudes qui laisse invariants deux 
points de la droite à l’infini. La géométrie euclidienne 
métrique est un cas particulier de la précédente. 

Une géométrie dont les transformations du groupe 
principal admettent d’autres invariants est une géomé¬ 
trie non euclidienne. Par exemple, les transformations 
qui laissent invariante une ellipse ou une hyperbole 
définissent respectivement la géométrie elliptique et la 
géométrie hyperbolique, qui sont des exemples de 
géométries non euclidiennes. 

• Remarques. Il s’en faut que la classification 
précédente n’épuise toutes les géométries. Voici trois 
exemples importants. 

— Les géométries cartaniennes (du nom du 
mathématicien français Élie Cartan) sont caractérisées 
par un groupe fondamental G plus général que le 
groupe projectif et concernant ce qu’on nomme des 
variétés. Elles contiennent, à titre de cas particuliers, 
les géométries classées par Klein et la géométrie 
riemannienne, fondée sur la notion de distance. 

— La géométrie algébrique fait intervenir le 
groupe des transformations dites birationnelles. Les 
composantes (x l5 x 2 , ..., x n ) qui, dans les géométries de 
Klein ou dans celles de Cartan, varient d’une manière 
continue (c’est-à-dire peuvent prendre des valeurs 
irrationnelles), sont ici astreintes à être rationnelles. 
Les groupes fondamentaux ne sont donc pas continus. 


Aperçu historique. 


Euclide tel que l’a rêvé Max Ernst. (1945. Coll. J. et D. de Ménil.) 


Nous avons déjà donné de nombreuses informations 
sur l’histoire de la géométrie grecque, et nous n’y 
reviendrons pas ici : nous fournirons quelques préci¬ 
sions sur l'évolution des principales branches de la 
géométrie. Nous recommandons au lecteur de se ^ 
reporter à la p. 143 pour les définitions des principales ^ 
notions évoquées. ~ 

I 

La géométrie projective. ^ 

, ^ 

• Les origines de la geometrie projective 

remontent aux recherches de Desargues (1639). A @ 
l’époque, les géomètres (Cavalieri, Mydorge, etc.) 
s’intéressaient principalement aux coniques, en utili- J 
sant les vieilles méthodes du géomètre grec Apollo- * 
nius (v. 200 av. J.-C.), auteur d’un traité fondamental . 
sur ce sujet, largement commenté au Moyen Age et à la 5 
Renaissance. Desargues a étudié d’une manière très ^ 
nouvelle la section d’une surface conique par un plan, ^ 
en introduisant la transformation projective. Ses idées $ 
ont été reprises par Pascal ( Essay pour les Coniques, © 
1640) et par La Hire. C’est Desargues qui introduisit le ^ 
concept de point à l’infini sur une droite, en considé- £ 
rant un faisceau de droites parallèles comme un | 
faisceau de droites se rejoignant à l’infini : un cylindre 1 
est alors un cône dont le sommet est à l’infini, etc. | 
Deux notions très importantes sont impliquées par la ^ 
théorie de Desargues. § 

1 - Desargues définit une transformation qui fait 
correspondre d’une manière biunivoque des points 
alignés et des droites concourantes ; cette transforma¬ 
tion est appelée involution. 

2-11 prend en considération la notion & homo¬ 
logie à propos des triangles : deux figures sont homo- 
logiques lorsqu’on peut les faire correspondre point 
par point de sorte que les droites qui passent par deux 
points homologues se rencontrent en un point fixe 
appelé centre d’homologie. 

• Au XVIII e siècle, la géométrie projective est 
encore dans les limbes, les mathématiciens semblant 
être dévorés par le calcul infinitésimal et par la géomé¬ 
trie analytique. Toutefois les problèmes de représenta¬ 
tion des figures par des perspectives, bien connus des 
savants de la Renaissance italienne et flamande et des 
architectes, va connaître un renouveau très important 
avec les travaux de Monge (à partir de 1770, publiés 
synthétiquement dans sa Géométrie descriptive en 
1799). Reprenant une méthode inaugurée par le peintre 
Dürer en 1525, Monge représente les figures à trois 
dimensions par deux projections, l’une sur un plan 
horizontal, l’autre sur un plan vertical (voir p. 91). 

Ce faisant, il est conduit à examiner comment se 
transforment les propriétés des figures au cours de ces 
projections, et quelles sont celles qui se conservent. 
L’intérêt pour ce genre de recherche va conditionner la 
naissance officielle de la géométrie projective, au 
début du siècle suivant. 

• Au XIX e siècle, alors que les ambitions napo¬ 
léoniennes mettent l’Europe à feu et à sang, la géomé¬ 


trie à la manière grecque semble définitivement clas¬ 
sée parmi les objets de musée : on continue à l’ensei¬ 
gner aux enfants des écoles et aux collégiens, pour 
leur faire comprendre les rigueurs du raisonnement 
mathématique, mais les savants ne s’y intéressent plus. 
Déjà en 1781 le grand mathématicien Lagrange écrivait 
à D’Alembert, à propos de la géométrie : 

«... Il me semble ... que l’abîme est trop profond, et 
qu’à moins qu’on ne découvre de nouveaux filons, il 
faudra tôt ou tard l’abandonner... », 

et il continue en déclarant que le temps n’est pas loin 
où les chaires de géométrie deviendront « ce que sont 
actuellement les chaires d’arabe dans les uni¬ 
versités » : Euclide, pour Lagrange, il y a deux siècles, 
c’était déjà le « géomètre de papa ». 

Cependant le nouveau filon prédit par le grand 
mathématicien vit le jour. C’est un élève de Monge, 
Poncelet, qui le découvrit. Participant comme officier à 
la campagne de Russie, il eut le bonheur d’être fait 
prisonnier par les Russes en 1812. Loin des canons, 
des retraites et des engelures, dans le calme de sa 
captivité, il eut tout le loisir de découvrir ce qu’il appela 
les propriétés projectives des figures, décrites dans un 
Traité, publié en 1822. 

Poncelet, reprenant un certain nombre des concepts 
de Desargues, notamment la notion des éléments à 
l’infini, qu’il introduit systématiquement, définit la 
transformation par polaires réciproques, qui sera 


généralisée sous le nom de corrélation. Il fait appa¬ 
raître le principe de dualité (voir ci-après, p. 87), et 
donne une place très importante aux transformations 
géométriques pour résoudre des problèmes de géomé¬ 
trie (en faisant subir à une figure une transformation 
déterminée, on la transforme dans une autre figure, 
sur laquelle on peut étudier plus commodément les 
propriétés cherchées : ainsi les propriétés des coni¬ 
ques peuvent se déduire de celles du cercle). 

La méthode de Poncelet fut approfondie par Ger- 
gonne, Chasles (1852) en France, von Staudt (1856) et 
Steiner en Allemagne. Traduite en langage analytique, 
ce qu’on a appelé la tendance projective en géométrie, 
allait faire apparaître des propriétés nouvelles, non 
seulement en ce qui concerne les relations géométri¬ 
ques, mais aussi, ce qui est le plus remarquable, en ce 
qui concerne le langage analytique lui-même (travaux 
de Plücker sur les coordonnées homogènes, voir l’his¬ 
toire de la géométrie analytique, p. 94). Signalons 
aussi, parmi les géomètres qui ont participé au déve¬ 
loppement de la géométrie projective après Poncelet : 
Môbius, Clifford, Cremona et Brianchon. 

Dans la seconde moitié du XIX e siècle, la géométrie 
projective et l’analyse se complètent harmonieusement 
dans bien des domaines : la méthode mixte (Cayley, 
Sylvester, Hermite, Clebsch, Elie Cartan) se développe. 
Parallèlement la géométrie devient plus abstraite et se 
transforme en une combinatoire. 
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GÉOMÉTRIE DIFFÉRENTIELLE ET GÉOMÉTRIE ALGÉBRIQUE 


• Au XX e siècle, le cadre de la géométrie projec¬ 
tive s’élargit. On construit des géométries projectives 
sur des corps K de nombres autres que les nombres 
réels : ce sont les géométries des groupes continus 
finis de Lie, Killing et Elie Cartan. D’autre part diverses 
questions de géométrie infinitésimale (voir ci-dessous, 
b) donnent naissance à ce qu’on a appelé la géométrie 
projective différentielle, dans laquelle le groupe fonda¬ 
mental est le groupe projectif (travaux de Wilczynski, 
Fubini, Terracini, Bompiani, Segre, Bol, Godeaux, etc.). 


La géométrie analytique. 

L’histoire de la géométrie analytique, marquée 
essentiellement par les travaux de Descartes, Euler et 
Cramer et de Plücker est résumée p. 93, en guise 
d’introduction à l’étude de cette branche de la géomé¬ 
trie. 


Géométrie infinitésimale et différentielle. 

• Une nouvelle classe de problèmes géométri¬ 
ques est née avec l’étude analytique des courbes et 
des surfaces, au XVII e et au XVIII e siècles. En effet, la 
géométrie analytique classique peut répondre à des 
questions telles que : 

— Quelle relation f(x, y) = 0 existe-t-il entre les 
coordonnées d’un point quelconque M sur une courbe 
C (notion d’équation d’une courbe) ? 

— Quels sont les points d’intersection de deux 
courbes définies par leur équation ? 

— Quel est le lieu géométrique — défini par son 
équation — des points M vérifiant certaines relations 
(affines ou métriques) ? 

— Etc. 

Mais, dès que les mathématiciens se sont trouvés en 
présence de courbes du second ordre (coniques), du 
troisième ordre (cubiques) ou d’un ordre supérieur, ils 
ont eu à se poser de nouvelles questions, du genre : 

— Quelle est l’équation de la tangente et de la 
normale à une courbe en un point ? 

— Quel est le rayon de courbure d’une courbe 
en un point ? 

— Comment mesurer la surface limitée par un 
arc de courbe, l’axe des xet deux droites parallèles à 
l’axe des y ? 

— Etc. 

La solution de ces problèmes exige qu’on fasse 
intervenir de nouveaux concepts, en particulier ceux 
de dérivée, de différentielle, de primitive et d’ intégrale. 
Ces concepts sont définis dans le cadre du calcul 
différentiel et intégral ou calcul infinitésimal, inventé à 
la fin du XVII e siècle par Leibniz (en 1672) et Newton 
(dès 1669, mais ses travaux sur le calcul infinitésimal 
ne furent publiés que plusieurs années plus tard). 

L’application de l’analyse à la géométrie constitue la 
géométrie infinitésimale. 

Au XVIII e siècle, la géométrie infinitésimale fut princi¬ 
palement l’œuvre d’Euler et de Monge. Ces auteurs ont 
défini, à l’aide des concepts créés par l’analyse, les 
notions de cercle osculateur, de développée et de 
développante, de rayon de courbure, de sphère oscula- 
trice, etc. Monge (1775) étudie les surfaces développa¬ 
bles en se fondant sur la discussion d’une équation aux 
dérivées partielles (voir à quoi correspond cette notion 
p. 118), et les problèmes de surface minimale. L’en¬ 
semble de ces découvertes est systématisée dans le 
traité de Monge intitulé Application de l’analyse à la 
géométrie, publié en 1807. 

• Au XIX e siècle, Gauss montre comment la 
géométrie des surfaces peut être étudiée par le calcul 
infinitésimal (1827), en introduisant les coordonnées 
curvilignes. Cette méthode permet une étude élégante 
des lignes qui sont un plus court chemin entre deux 
points A et B d’une surface, et qu’on nomme des 
géodésiques. Au même mouvement de pensée appar¬ 
tiennent les travaux de Jacobi, Lamé (1837), Barré de 
Saint-Venant (1846), Weingarten, et de l’Ecole italienne 
(Brioschi, Cremona, etc.). 

• La géométrie différentielle se développe à 
partir des travaux de Riemann (1854) et la frontière 
avec la géométrie infinitésimale est difficile à délimiter, 
car les deux disciplines se commandent l’une l’autre. 
L’objet de la géométrie différentielle est l’étude des 
propriétés des surfaces courbes et des variétés à 
plusieurs dimensions dans le voisinage d’un de ses 
éléments. Par exemple, une surface sphérique a tou¬ 
jours la même forme, au voisinage de tous ses points ; 
les autres surfaces ne possèdent pas cette propriété, 
de sorte que la plus courte distance entre deux points 
n’est pas la même selon la nature de la surface 
considérée. 


Cet enfant qui se regarde dans une glace et 
l’image que celle-ci renvoie sont deux figures (à 
trois dimensions) dans l’espace, égales, mais non 
superposables. 


La géométrie différentielle est donc, du moins en ses 
débuts, une géométrie métrique. Au XIX e siècle, elle 
correspond aux travaux de Grassmann, Beltrami (sur 
les invariants différentiels), Christoffel, Lipschitz, 
Enneper et Lie (surface minimale), Darboux (systèmes 
triples orthogonaux), Bianchi, Henri Poincaré (proprié¬ 
tés des courbes définies par les équations différentiel¬ 
les, en 1881-1886). L’apport de la théorie des groupes 
fut décisif en ce domaine (travaux de Lie). 

• Au XX e siècle, la géométrie infinitésimale se 
prolonge par la géométrie différentielle moderne, dans 
laquelle on peut distinguer deux tendances importan¬ 
tes : la géométrie projective différentielle, dans 
laquelle le groupe fondamental est le groupe projectif 
(Cotton, Elie Cartan, G. Fubini, Vicensini, C. Segre), et 
la géométrie différentielle globale (Ehresmann, 
S. Chern, Lichnerowicz), en rapport avec la topologie. 

La géométrie algébrique. 

La géométrie algébrique est une branche des mathé¬ 
matiques née au XIX e siècle (M. Noether, en 1871, 
Clebsch, en 1868, et l’École italienne de Cremona, 
C. Segre, Enriques, etc.). Elle s’est d’abord posé des 
problèmes relatifs à l’étude des branches d’une courbe 
algébrique au voisinage d’un point singulier. Ce pro¬ 
blème imposa l’introduction d’un certain nombre de 
notions nouvelles : courbe adjointe, système linéaire 
de courbes planes, etc. Ces recherches furent éten¬ 
dues par Clebsch aux surfaces algébriques. 

Au XX e siècle, la géométrie algébrique a été étendue 
aux variétés à plusieurs dimensions : recherche des 
variétés algébriques dépourvues de point singulier, 
étude des variétés algébriques dont les points ont des 
coordonnées qui sont des fonctions rationnelles de 
certains paramètres, etc. Plus récemment, la géométrie 
algébrique a fait l’objet des travaux de Chevalley, 
Zariski, A. Weil, etc. 

Conclusion. 

En guise de conclusion, nous aimerions citer ces 
réflexions de Bourbaki sur l’histoire de la géométrie : 

« ... [après le programme d’Erlangen, en 1872] la 
géométrie classique — exceptions faites de la géomé¬ 
trie algébrique et de la géométrie différentielle, désor¬ 
mais constituées en sciences autonomes — se fane 
brusquement et perd tout son éclat... Pour le mathéma¬ 
ticien professionnel, la mine est tarie, puisqu’il n’y a 
plus là de problèmes de structure susceptibles de 
retentir sur d’autres parties des mathématiques ; et ce 
chapitre de la théorie des groupes et des invariants 
peut être considéré comme clos jusqu’à nouvel ordre. 



Ainsi, après le programme d’Erlangen, les géomé¬ 
tries euclidienne et non euclidienne, du point de vue 
purement algébrique, sont devenues de simples langa¬ 
ges, plus ou moins commodes pour exprimer les 
résultats de la théorie des formes bilinéaires, dont les 
progrès vont de pair avec ceux de la théorie des 
invariants. » 

(N. Bourbaki, Éléments d’histoire des mathématiques, 
Paris, Hermann, 1969, pp. 171-172.) 


LA GÉOMÉTRIE ÉLÉMENTAIRE. 

Il n’est pas question, dans le cadre de ce livre, de 
décrire toutes les géométries élaborées depuis 
2 500 ans par l’esprit humain. En particulier, les théo¬ 
ries de la géométrie différentielle et de la géométrie 
algébrique sont d’un niveau trop élevé pour pouvoir 
être présentées avec quelque intérêt dans un exposé 
de vulgarisation comme celui-ci. Nous nous contente¬ 
rons de rappeler ici quelques propriétés (affines, métri¬ 
ques et projectives) des figures dans l’espace [R 3 , sous 
une forme axiomatique. Le lecteur trouvera en outre un 
résumé des principaux résultats de la géométrie eucli¬ 
dienne classique p. 143, dans lequel nous avons 
ajouté quelques indications historiques simples sur la 
naissance des géométries non euclidiennes. 


Les axiomes de base 
de la géométrie plane. 

L’image intuitive d’un plan est donnée par une feuille 
de papier rigide, étendue à l’infini, ou par la surface de 
l’eau tranquille. Dans un tel plan, on peut dessiner des 
points, des lignes droites, des lignes courbes et des 
figures composées de ces points et lignes. L’étude 
expérimentale de ces figures fait apparaître deux clas¬ 
ses de propriétés : 

— des propriétés qui restent invariantes lors¬ 
qu’on fait subir aux figures des transformations 
appartenant au groupe des dilatations (voir p. 76) ; ces 
propriétés sont dites affines et la géométrie qui les 
étudie est la géométrie plane affine ; 

— des propriétés qui restent invariantes lors¬ 
qu’on fait subir aux figures des déplacements ; ce 
sont des propriétés métriques (c’est-à-dire relatives à 
la mesure des longueurs et des angles) et la géométrie 
qui les étudie est la géométrie plane métrique. 

Par exemple, une propriété telle que: « le point M 
est le milieu du segment AB » reste vraie lorsqu’on 
«dilate» le segment AB par un procédé tel que 
l’agrandissement photographique : c’est une propriété 
affine. En revanche la propriété qui s’énonce : « le 
segment AB a une longueur égale à 3 cm » n’est pas 
conservée par la dilatation, ce n’est pas une propriété 
affine. Toutefois, si l’on se contente de « déplacer » le 
segment AB — matérialisé par une tige rigide — il est 
vérifié par l’expérience courante que sa longueur ne 
varie pas : la longueur d’un segment, c’est-à-dire la 
« distance » entre deux points du plan, est une pro¬ 
priété métrique. On notera encore les remarques sui¬ 
vantes : 

1 - une propriété métrique est nécessairement 
affine, mais une propriété affine n’est pas nécessaire¬ 
ment métrique ; par conséquent la géométrie métrique 
est un cas particulier de la géométrie affine ; 

2 - l’expérience physique qui consiste à dépla¬ 
cer une règle ne conserve pas rigoureusement sa 
longueur ; la théorie de la relativité montre que cette 
longueur varie en fonction de la vitesse du déplace¬ 
ment pendant le déplacement (mais la règle retrouve 
sa longueur initiale au repos lorsqu’elle est au repos 
dans sa position finale). 

La géométrie, en tant que branche des mathémati¬ 
ques, n’est pas une science expérimentale ; c’est une 
discipline qui déduit les propriétés des figures par le 
raisonnement pur, à partir de quelques axiomes fonda¬ 
mentaux, que nous allons rapidement passer en revue. 

Axiomes d'existence (groupe E). 

• Énoncé. 

E 1 - On considère un ensemble, désigné par la 
lettre grecque n (« pi majuscule ») et appelé plan 
(cette appellation n’est pas nécessaire si l’on fait de la 
géométrie abstraite ; elle facilite néanmoins l’énoncé 
des propositions). Les éléments de cet ensemble sont 
notés par des lettres minuscules, affectées ou non d’un 
indice: a, b, c, ..., a,, b 1t ..., a n , b n , ... Pour la 
commodité des exposés, nous dirons « le point a » 
plutôt que « la lettre a ». 
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AXIOMES DE LA GÉOMÉTRIE PLANE EUCLIDIENNE 


E 2 - Il existe dans n des sous-ensembles de 
points notés à l’aide de lettres majuscules affectées ou 
non d’un indice: A, B, C, ... ; ces parties de n 
s’appellent des droites et forment un ensemble 3> 
inclus dans n. On peut dire indifféremment: 

« A C n » ou «A est une droite du plan n » 

(Le lecteur est prié de se reporter éventuellement au 
n° 512.1, où sont expliqués les symboles de la théorie 
des ensembles.) 

E 3 - L’ensemble Fl contient au moins deux 
droites. 

E 4 - Toute droite A contient au moins deux 
points. 

• Commentaires et notations. L’idée fondamen¬ 
tale, c’est que n est un ensemble de points. Tout 
sous-ensemble de n est une figure dans le plan n. 
L’axiome E 3 est important, car il affirme qu’il existe au 
moins deux figures particulières dans n (c’est-à-dire 
deux sous-ensembles de points), à savoir deux droites. 
Remarquer aussi le parallélisme des axiomes E 3 et E 4 : 
tout plan comprend au moins deux droites, toute droite 
contient au moins deux points. 

En principe, on pourrait continuer à utiliser ici les 
notations de la théorie des ensembles. Néanmoins on 
se sert parfois d’expressions différentes empruntées à 
l’expérience quotidienne. Précisons donc le vocabu¬ 
laire : 

Écriture 

conven- Signification 

tionnelle 


A, B et C sont des figures quelconques. 


a E II 

Le point a est dans le plan II. 

A C II 

L'ensemble de points A (la figure A) est 
dans le plan II. 

a E A 

Le point a appartient à la figure A (est 
sur A), A passe par a. 

a É A 

Le point a est extérieur à A. 

AD B C 

Les figures A et B se coupent selon la 
figure C ; A et B sont sécantes. 

An B = o 

A est extérieur à B. A et S n’ont aucun 
point commun. 


A, B et C sont des éléments de Çt (des droites). 


a E A 

Le point a est sur la droite A ; A passe 
par a. 

a £ A 

Le point a n’est pas sur A. 

A n B = { a } 

Les droites A et B se coupent selon { a } 

A n B - a 

ou, abusivement : les droites A et B se 
coupent en a (ont pour intersection a). 

A n B = 0 

Les droites A et B ne se rencontrent pas 
(ou : sont strictement parallèles). 

A B 

Les droites A et B sont confondues. 

A = B ou 

Les droites A et B sont parallèles (ou 

A n B = 0» 

A II B). 

[ a, b } 

Bipoint : figure formée par deux points ; 
ne pas confondre avec segment [a, b] 
(voir ci-dessous). 

( a, b, c} 

Tripoint : figure passant par trois points ; 
ne pas confondre avec triangle ; a, b et c 
sont les sommets du tripoint. 


Deux façons d’exprimer les relations 
fondamentales de la géométrie. 


— Remarque : quand on écrit : A //B, on envi¬ 
sage donc deux cas, A n B = 0 et A = B. Dans le 
langage courant on distingue ces deux cas en disant : 

— A et B sont confondues pour traduire A = B ; 

— A et B sont parallèles au sens strict pour 
traduire A n B = 0. 

Axiomes d'incidence (groupe I). 

• Énoncé. 

11 - Par deux points a et b il passe une seule 
droite D, notée D(a, b). 

1 2 - Par tout point a il passe une parallèle et une 
seule à toute droite A. 

• Commentaires. Ces axiomes sont, en prin¬ 

cipe, arbitraires. En fait, ils ont été choisis pour 
convenir à notre expérience physique quotidienne (fil 
tendu, rails, directions de deux fils à plomb suspendus ^ 
à un même axe, etc.). En choisissant d’autres axiomes | 
d’incidence, nous bâtirions d’autres géométries (rie- | 
manienne, etc.) qui conviennent à d’autres types | 
d’ensembles de points, comme on en rencontre, par ^ 
exemple, en physique relativiste. g 

L’axiome l 1 permet de définir I alignement de trois" 4 
points : si un point c, distinct de a et b , appartient à 
l’ensemble D(a, b), alors a, b et c sont dits alignés. ^ 
L’axiome l 2 est le fameux « postulat >> d’Euclide. On ® 
l’avait baptisé ainsi, jadis, parce qu’on le considérait S 


comme une proposition indispensable à la construc¬ 
tion de la géométrie, mais indémontrable ; le maître 
demandait (postulare = « demander », en latin) à son 
disciple de l’accepter sans discussion. En déclarant 
que ce n’est pas un postulat, mais un axiome, on 
insiste sur son caractère arbitraire, c’est-à-dire sur le 
fait qu’on peut le refuser et le remplacer par un autre 
axiome (d’où une nouvelle géométrie). En langage 
«euclidien», un postulat est une manière de dire: 
« c’est cela ou rien » ; un axiome est une manière de 
dire : « c’est cela ou autre chose ». 

Si nous choisissons l 2 comme axiome, nous ne 
dirons plus A est une parallèle à B, mais A est la 
parallèle à B ( menée de a ou issue de a). Cette 
expression englobe le cas particulier où a appartient à 
B (qui entraîne A = B). 


Axiome d'ordre (axiome O). 

• Énoncé. Sur chaque droite D on peut définir 
deux relations d’ordre total (voir p. 17), opposées l’une 
de l’autre. Lorsqu’une droite D est munie d’une telle 
relation, on l’appelle une droite orientée. 

• Notation. La relation d’ordre s’écrit : « < » 
(lire : « antérieur à »). Le symbole « < » signifie : 

« strictement antérieur à ». Par exemple : 

— a < b signifie : soit a antérieur au sens strict 
à b ; soit a confondu avec b. 

— a < b signifie : a ne peut jamais être, 
confondu avec b (on dit aussi a est à gauche de b, ou b 
est à droite de a). 

Si a est antérieur à b, on peut aussi dire que b est 
postérieur à a ou vient après a, ce qui s’écrit > ou >, 
selon que la relation est générale ou stricte. 

• Remarque fondamentale. Les axiomes d’exis¬ 
tence et d’incidence posent qu’une droite contient au 
moins deux points, et que deux points définissent une 
droite ; mais ils ne précisent pas si une droite possède 
plus de deux points. Dans ce qui suit, nous n’avons 
donc pas le droit de dire qu’il existe toujours plus de 
deux points sur une droite, mais, par contre, nous 
avons le choix de présenter ce fait comme une hypo¬ 
thèse. Nous poserons plus loin l’axiome suivant : il 
existe une infinité de points sur une droite. 

• Commentaire. Soit une droite D définie par 


deux points a et b (axiome 1^. Un intervalle sur cette 
droite est un ensemble de points de cette droite, dite 
aussi support de l’intervalle en question. Il peut exister 
plusieurs types d’intervalles sur une droite orientée 
D(a, b). 

— Le segment [a, b] est Vintervalle fermé des 
points x appartenant à D tels que a < x < b. S\ a = b, 
on a [a, b] = { a }, c’est-à-dire que le segment se réduit 
au point a; si a^b, le segment [a, b] comprend 
d’autres points que a. La droite D étant orientée, le 
segment [a, b] est lui-même orienté. 

— Un segment privé de ses extrémités s’écrit 
]a, b[ ; c’est l’ensemble des points x qui vérifient la 
relation d’ordre strict a < x < b. Si l’ensemble ]a, b[ 
n’est pas vide, on dit que x est entre a et b. 

— Un segment privé d’une de ses extrémités est 
dit intervalle semi-ouvert (à gauche ou à droite) et noté 
]a, b] s’il est privé de a, [a, b[ s’il est privé de b. Tout 
point x appartenant à cet intervalle est tel que : 

a < x < b pour ]a, b] et a < x < b pour [a, b[. 

Dans tous les cas D est le support de l’intervalle 
considéré, a et b sont les extrémités de cet intervalle. 

• Deux définitions importantes sont liées à 
l’existence de Vaxiome d’ordre qui traduit, simplement, 
l’expérience que nous avons, quand nous dessinons 
l’image d’une droite, de passer d’un point donné à un 
autre, situé à droite du premier quand nous la traçons 
de la gauche vers la droite (c’est-à-dire dans le sens de 
l’écriture commune en Occident). 

— Notion de demi-droite. Soit une droite D et 
un point a tel que a appartienne à D ; a partage 
l’ensemble D en deux sous-ensembles disjoints (c’est- 
à-dire qui n’ont pas d’éléments communs) : l’un 
comprend tous les points antérieurs à a (à gauche de 
a), l’autre tous les points situés à droite de a. Ces deux 
ensembles sont appelés demi-droites ouvertes d’ori¬ 
gine a et notés ]., a[ pour celui qui est formé des 
points x à gauche de a (x < a), ]a,.[ pour celui formé 
des points x à droite de a (a < x). Si l’on adjoint a à 
l’une de ces demi-droites ouvertes, on définit une 
demi-droite fermée d’origine a. 

D’après l’axiome E 4 , il existe certainement un second 
point b, distinct de a, sur la droite D. On a donc, ou 
bien a < b, ou bien b < a. Supposons qu’on ait a < b ; 
les deux demi-droites ouvertes définies ci-dessus sont 
alors désignées respectivement par ]ba , a[ et ]a,ab[. 


Salle de géométrie de l’ancien Collegium Maius de l’université de Cracovie. A l’usage des élèves, et aussi dans 
un but décoratif, les problèmes d’Euclide sont dessinés sur les murs. 
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STRUCTURE DE LA DROITE 

La demi-droite ]a, ab[ n’est certainement pas vide, 
puisqu’elle comprend au moins un point (le point b) ; 
la demi-droite ]ba, a[ peut être vide, puisque nous 
n’avons défini aucun point dans ce sous-ensemble. 

— Notion d’ ensemble convexe : Soit A une 
figure du plan n, c’est-à-dire un sous-ensemble de 
points inclus dans FI, sous-ensemble qui n’est pas 
nécessairement une droite, et soient deux points a et b 
contenus dans A : 

a G A, b G A. 

Si, quels que soient a et b, l’ensemble [a, b] — 
c’est-à-dire le segment [a, b] — est inclus dans A, Ae st 
dit convexe. Voici une image de cette notion (figure 
ci-dessous). 



Image d’un ensemble de points convexe. 

La surface A est un ensemble de points ; a et b sont 
deux points particuliers et l’ensemble [a, b] est repré¬ 
senté par le trait bleu ab ; ce « trait » est inclus dans 
A, donc A est convexe; par contre A' n’est pas 
convexe (une partie du trait bleu n’est pas dans A ). 

Axiome de partage (axiome P). 

• Énoncé. La relation 91 = « être du même côté 
d’une droite D » est transitive. 

• Commentaire. Définissons $1 : deux points a 
et b sont dits situés du même côté d’une droite D si 
l’ensemble [a, b] et l’ensemble D n’ont aucun point 
commun, c’est-à-dire si leur intersection est vide : 

[a, b] n D = 0, 

ce qui peut aussi s’exprimer ainsi : le segment [a, b] ne 
rencontre pas la droite D. 

Page 16, nous avons convenu de noter 21 \ a, b $ 
une relation 2t entre a et b. Conservons cette notation 
et renvoyons le lecteur aux définitions des propriétés 
d’une relation binaire. 

L’axiome P peut aussi s’écrire : 
si < 3i\a,b\ et <3l\b,c \, alors < 3i\a,c\, 

c’est-à-dire : si a et b sont d’un même côté de D et si, 
en même temps, b et c sont d’un même côté de D, 
alors a et c sont d’un même côté de D ; ou encore : si 
deux points sont d’un même côté d’une droite par 
rapport à un même troisième, alors ils sont tous deux 
d’un même côté de cette droite (nous constatons, au 
passage, que l’axiome P traduit une expérience 
banale). L’axiome de partage est équivalent à 
l’énoncé : « Tout demi-plan est convexe. » 

Or, il est facile de démontrer que est, en outre, 
réflexive et symétrique. 

— 91 est réflexive , car on peut écrire : 


Notation symbolique Notation explicite 


[a, aj [ a }. 

segment 

fa, a]= ensemble { a }. 

a<£D^{a}<tD 

Si a n’appartient pas à D, 

[a, al n D 

alors l’ensemble a (mis 

= 0. 

entre deux accolades) 
n’est pas inclus dans D, 
alors l’intersection du 


segment [a, aj et de la 
droite D est un ensemble 


vide. 


— $1 est symétrique, car [a, b] = [b, a], les 
deux ensembles constituent le même ensemble, donc : 

[a, b]n D = [b, a] D D = 0 . 

• Conséquence. La relation « être du même 
côté de D » est réflexive, symétrique, transitive ; c’est 
donc une relation d’équivalence entre les points a et b. 
Il en résulte que les points d’un plan TI dans lequel on a 
tracé une droite D se répartissent en deux classes 
d’équivalence n 1 et ri 2 appelées demi-plans de bord D 
(un demi-plan est ouvert s’il ne contient pas la droite D, 
et fermé dans le cas contraire). 


• Propositions équivalentes à l’axiome de par¬ 
tage. On peut montrer, par un enchaînement convena¬ 
ble de conséquences, que l’axiome P est équivalent 
aux deux propositions suivantes, que nous appellerons 
P c et P p : 

— P c : pour tout couple {D, D' } de droites stric¬ 
tement parallèles (c’est-à-dire qu’on exclut le cas 
D = D'), et pour tous points m, m', n, n' tels que le 
bipoint { m, n } appartienne à D et le bipoint { m', n' } 
appartienne à D', toute parallèle A à ces droites qui 
coupe le segment [m, m '] coupe aussi le segment 
[n, n'I 

— P p (théorème de Pasch). Cette proposition 
exige la définition préalable : étant donné un tripoint 
{ a, b, c}, les ensembles de points (segments) [a, b], 
[a, c] et [b, c] sont appelés les côtés du tripoint. Cela 
dit, nous pouvons énoncer le théorème de Pasch : 

« toute droite qui rencontre un côté d’un tripoint en 
rencontre aussi un second ». 

Les propositions P c et P p sont plus « commodes » 
que P, car elles correspondent à des « cas de figures » 
(il faut entendre par là des combinaisons de 
sous-ensembles de FI) précis. Comme on peut démon¬ 
trer que : 

P => P c => P p => P , 

on peut choisir indifféremment comme axiome soit P, 
soit P c , soit P p . Noter que si P p est choisi comme 
équivalent à P, il ne faut plus l’appeler « théorème de 
Pasch », mais « axiome de Pasch ». Par contre, P 
deviendra démontrable : ce sera le « théorème de 
partage ». 

• Observations importantes. On obtient, à partir 
des axiomes précédents, les théorèmes suivants : 

— si une droite contient plus de deux points, 
elle en contient une infinité (ce théorème ne peut être 
démontré uniquement à partir des axiomes I, ce qui 
démontre Vindépendance des axiomes d’ordre et de 
partage par rapport aux axiomes d’incidence) ; 

— toute demi-droite ouverte contient une infi¬ 
nité de points ; 

— tout demi-plan ouvert contient une infinité de 
points ; 

— tout intervalle ouvert contient une infinité de 
points. 

Premières conséquences 
de ces axiomes. 

Conséquences des axiomes d'existence et d'incidence. 

Le seul jeu de ces axiomes va nous faire découvrir 
les propriétés fondamentales concernant les droites 
parallèles. Ce qu’il est important de comprendre, ici, 
c’est la méthode de démonstration, rigoureusement 
logique, et que nous donnerons dans quelques cas 
seulement, à titre d’exemples. 

• Théorème 1 - Deux droites quelconques D et 
D' sont, soit parallèles, soit sécantes. Dans ce dernier 
cas, elles ont un point commun et un seul. 

Il s’agit, bien entendu, de parallèles au sens large. 
Voici comment cela s’écrit : 

D, D' G 2) | ou bien D fl D' = { a } 

VD, VD' 1 ou bien D // D'. 

• Théorème 2 - La relation « // » est une rela¬ 
tion d’équivalence sur 2). Démontrons ce théorème : il 
faut démontrer que « // » est une relation réflexive, 
symétrique et transitive pour tout couple D, D'. 

— Réflexivité : D = D' entraîne D // D' : la rela¬ 
tion est réflexive. 

— Symétrie : si DHD' = 0 (ce qui entraîne 
D II D'), alors D'flD=DnD'=0 (commutativité de 
« D »), de sorte que D ' // D. 

— Transitivité : enfin si l’on a à la fois D // D' et 
D' Il D", cela entraîne que D // D". En effet, exami¬ 
nons toutes les relations possibles entre D et D" : 

1. On peut avoir D = D" ; dans ce cas D // D" est 
vrai (puisque « // » est pris au sens large). 

2. On peut avoir D strictement parallèle à D", 
c’est-à-dire Dn D" = 0, donc, ici aussi, D // D". 

3. On peut avoir D n D” = a ; mais, en vertu de 
l’axiome l 2 , il passe par a une parallèle et une seule à 
D' ; comme on doit avoir D // D' et D " // D', passant 
toutes deux par a, cela signifie que D - D" et que l’on a 
encore D // D". La relation « // » est donc transitive. 

(Cette dernière propriété s’énonce souvent : si deux 
droites sont parallèles, toute parallèle à l’une est 
parallèle à l’autre.) 

Conclusion : la relation « est parallèle à » est réfle¬ 
xive, symétrique, transitive ; c’est donc une relation 
d’équivalence sur 2). 


Étant donné une droite A, on peut diviser les droites 
de 2) en deux catégories : celles qui sont parallèles à A 
et les autres. Les droites parallèles à A forment une 
classe d’équivalence pour le parallélisme. Une telle 
classe s’appelle une direction. Nous noterons les direc¬ 
tions par des lettres grecques minuscules : a, p,... Dire 
qu’une droite D a la direction a ou est un élément de la 
classe a, cela signifie qu’elle est parallèle à toutes les 
droites de cette classe. 

• Théorème 3-11 existe au moins deux direc¬ 
tions distinctes dans le plan. 

• Théorème 4-11 existe une bijection entré deux 
droites distinctes quelconques D et D 1 du plan : à tout 
point a de D on peut associer un point a' de D ', et tout 
point a' de D' a un correspondant distinct a dans D. 

Figures usuelles. 

La géométrie plane classique utilise des figures 
usuelles appelées « angles », « triangles », etc. Ces 
notions — tirées de l’expérience — ont été manipulées 
par tous les écoliers du monde. On pourrait presque 
dire que la géométrie élémentaire classique est, pour 
un enfant, la première découverte exotique : 
jusqu’alors, il ne connaissait que des mots évoquant 
les actes de la vie courante. Dès son entrée à l’école 
primaire, en même temps qu’il apprend à lire et à écrire 
ces mots de tous les jours, on lui fait découvrir les 
noms de ces formes, isolées de leur support utilitaire : 
triangle, parallélogramme, hexagone, noms étrangers, 
jamais rencontrés et bien propres à exalter l’imagina¬ 
tion linguistique d’un jeune enfant. 

Sur les figures de la page ci-contre nous avons 
donné les définitions abstraites de ces figures, consi¬ 
dérées comme des ensembles de points particuliers, 
en les accompagnant de leurs images, qui peuvent être 
interprétées comme des diagrammes de Venn commo¬ 
des. Le lecteur établira sans peine la correspondance 
avec les définitions classiques (dont il découvrira, nous 
l’espérons, la particularité). 


Structure de la droite. 

Historiquement, l’esprit humain ne s’est pas élevé 
d’emblée à cette conception abstraite de la géométrie. 
L’homme a d’abord mesuré des étendues et c’est pour 
faciliter ces mesures qu’il a créé, de bric et de broc, 
une géométrie qui, après récapitulation et mise en 
forme, est devenue la géométrie euclidienne. Les 
axiomes énoncés plus haut (A, E, I, O, P), qui suffisent 
pour étudier certaines propriétés fondamentales des 
figures (comme : le parallélisme, le fait pour une figure 
d’en couper une autre, les notions — très délicates du 
point de vue axiomatique — de domaine intérieur d’un 
polygone, etc.), sont insuffisants dès qu’il s’agit de 
problèmes de mesures (problèmes métriques). Tradui¬ 
sons cela en termes de « trains qui se rencontrent » : si 
l’on pose à un géomètre (abstrait) la question : 

« Quels chemins doivent suivre deux trains pour ne 
jamais se rencontrer ? » Avec les axiomes E, I, O et P il 
peut répondre de deux façons : 

1 - les deux voies doivent être parallèles au sens 

strict ; 

2 - la voie suivie par le premier train doit être 
entièrement contenue à l’intérieur d’un polygone (nous 
ne parlerons pas de « courbe » pour l’instant) et la voie 
du second train à l’extérieur de ce polygone. On pourra 
matérialiser l’intérieur et l’extérieur en construisant 
une muraille de Chine sur la frontière du domaine 
polygonal. 

Mais si on lui pose la question : 

« Comparer les chemins parcourus par les deux 
trains », il ne possède aucun axiome lui permettant d’y 
répondre. Nous allons établir ces axiomes et voir 
quelles conséquences il en résulte pour l’étude des 
figures, plus spécialement pour l’étude de la droite. 

Axiomes des distances (groupe D). 

Les axiomes des distances permettent d’aborder la 
géométrie métrique de la droite ; pour la notion de 
distance, voir aussi p. 106. 

• Énoncé. Étant donné deux points a et b du 
plan, distincts ou confondus, on peut toujours leur 
faire correspondre un nombre réel positif ou nul, noté 
d(a, b) ou encore, s’il n’y a pas de confusion possible, 
ab. Ce nombre est appelé distance des deux points a et 
b ; il vérifie les axiomes suivants : 

Dt - Pour tout c G [a, b] on a : ac + cb = ab. 

D 2 - ab = 0 entraîne a = b. 

D 3 - Pour tout couple (a, b) on a ab = ba. 
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LA RELATION DE CHASLES 


• Commentaires. La distance ab est parfois 
appelée « longueur du segment [a, b] ». 

Des axiomes D on tire immédiatement les consé¬ 
quences suivantes (qui sont donc des théorèmes) : 

— a=b=>ab = 0 (réciproque de D 2 , consé¬ 
quence de D^. 

— a^b=>ab>0 (« > 0 » se lit «positif» ou 
« plus grand que zéro »). En effet, puisque ab désigne 
un nombre réel positif ou nul (définition ci-dessus), et 
que a ^ b implique ab ^ 0, ab ne peut être que positif. 

— Pour tout point c de [a, b] on a ac ab. 

Axiome de continuité (axiome C). 

• Énoncé. Pour tout point a du plan, pour toute 
demi-droite d’origine a et pour tout nombre réel positif 
ou nul r , il existe au moins un point m de cette 
demi-droite telle que am = r (bien noter que r désigne 
un nombre réel positif ou nul et ne peut jamais être un 
nombre négatif, en vertu de notre définition). 

• Commentaire. Soit une droite D, un point a 
sur cette droite et supposons que D soit orientée (ce 
qui signifie : munie d’une relation d’ordre, a b par 


exemple). Étant donné un point m quelconque de D, la 
distance am, d’après la définition du paragraphe pré¬ 
cédent, est un nombre réel positif ou nul que nous 
désignerons par la lettre r (attention : r, dans ce qui 
suit, ne sera jamais négatif). Si nous décidons de faire 
correspondre, à chaque point m, un nombre réel 
quelconque (c’est-à-dire positif, ou nul, ou négatif), il 
nous faut préciser la loi suivante, que nous noterons 

m—^ f(m) : 

si m = a , à m correspond le réel r = 0 ^ f (a ) ; 

si a < m , à m correspond le réel r = f (m) ; 

si m < a , à m correspond le réel — r = f (m ). 

On dit qu’on a appliqué la droite D dans l’ensemble IR 

des réels ( appliquer = « mettre en correspondance »). 
On démontre que cette application est une bijection (à 
chaque point correspond un réel, à chaque réel corres¬ 
pond un point). 

Considérons maintenant le segment [m, n]. T rois cas 
peuvent se présenter : 

1. m a «s n : a est entre m et n ; on a am = — r 
et an = r' (positif) ; la distance d(m, n) = mn est égale 
à ma + an (d’après l’axiome D.,) ; or, ici : 


Figures géométriques usuelles. 





1. Secteur angulaire convexe. On considère les 
droites X et Y (dont les images sont les lignes bleues) 
et les demi-plans (X, o) — image en grisé — et (Y, o) 
— image en bleu clair ; les droites X et Y se coupent 
en o. On appelle secteur angulaire convexe l’ensem¬ 
ble de points intersection des deux demi-plans (X, o) 
et (Y, o) ; l’image de ce secteur est en gris foncé sur 
le diagramme. Si x6 X et y G Y, on peut désigner ce 
secteur par 

(o ; Sx, Sy) = (X, o) n (Y, o). 

Si m est un point quelconque du secteur (m ^ o), la 
demi-droite [o, om[ appartient au secteur. De même 
pour les points du segment [x, y], o est le sommet, les 
demi-droites [o, Sx[ et [o, Sy[ sont les côtés du 
secteur angulaire convexe (o ; 6%, Sy). D’autre part, 
tout secteur angulaire convexe peut être considéré 
comme la réunion (au sens de la théorie des ensem¬ 
bles) de toutes les demi-droites d’origine o qui cou¬ 
pent le segment [x, y]. (Le lecteur aura reconnu dans 
cette définition !’ angle saillant de la géométrie clas¬ 
sique.) 

Le complémentaire de l’ensemble (o ; ox, oy) est 
un secteur angulaire concave ; son image comprend 
les zones en bleu clair ou en grisé, mais non en croix. 
Toute demi-droite de sommet o ne coupant pas 
l’intervalle ]x, y[ est incluse dans ce secteur. (Le 
lecteur aura reconnu la notion classique d’ angle 
rentrant.) 

2. Ligne polygonale. On appelle ainsi un ensemble 
de segments consécutifs (segments ayant en 
commun une extrémité et cette extrémité seulement). 
Les segments [a, b], [b, c], ..., [f, g] sont les côtés de 
la ligne polygonale ; les points a, b, ..., f, g sont ses 
sommets. 

3. Polygone non croisé (ou, simplement, polygone). 
Ligne polygonale dont le premier et le dernier som¬ 
met coïncident et dont aucun côté ne coupe un autre 
côté non consécutif. Les segments joignant deux 
sommets non consécutifs sont appelés diagonales. 
On a tracé en bleu sur le diagramme l’image des 
diagonales issues du sommet a 6 . 

4. Polygone croisé. Polygone dont au moins deux 
côtés non consécutifs ont un point commun (point 
double) : ici les côtés a 3 a 4 et a 5 a 6 . 


5. Parallélogramme. C’est le polygone fondamen¬ 
tal de la géométrie élémentaire. Un parallélogramme 
est un polygone à quatre côtés (= quadrilatère) deux 
à deux parallèles ; /'enveloppe convexe du parallélo¬ 
gramme abcd est l’intersection (au sens de la théorie 
des ensembles) des bandes planes dont les bords 
sont les droites supportant les côtés, c’est-à-dire les 
bandes [D(a, b), D(c, d)] et [D(d, a), D(b, c)]. Cette 
enveloppe est en bleu sur le diagramme. Le parallé¬ 
logramme lui-même (c’est-à-dire l’ensemble des 
4 segments d’extrémités a, b, c et d) est la frontière 
de l’enveloppe convexe dont les points constituent 
/'intérieur du parallélogramme à condition de ne pas 
y inclure ceux de la frontière. Le complémentaire 
dans le plan de l’enveloppe convexe constitue /'exté¬ 
rieur du parallélogramme (par abus de langage). 

On démontre, d’après les conséquences des axio¬ 
mes de base, que les diagonales d’un parallélo¬ 
gramme sont sécantes, c’est-à-dire que l’ensemble 
[a, c]n[b, d] n’est pas vide et qu’il contient un 
élément unique, o, appelé point de concours des 
diagonales (le fait que, sur le diagramme, les images 
des diagonales se coupent ne permet de rien affir¬ 
mer : un diagramme n’est pas une démonstration ; 
d’ailleurs on peut concevoir un diagramme conven¬ 
tionnel où les droites ne seraient pas représentées 
par des lignes droites, comme pp. 79-80). 

6. Triangle : c’est un polygone à trois côtés, noté 
(a, b, c) ou abc quand aucune confusion n’est possi¬ 
ble. Les points composant l’ensemble du triangle 
sont ceux des segments [a, b], [b, c], [a, c] ; ils 
comprennent en particulier le tripoint {a, b, c}. Un 
triangle n’a pas de diagonale et son enveloppe 
convexe est l’intersection des trois demi-plans fer¬ 
més de bords respectifs D(a, b), D(b, c) et D(a, c). 
Cette enveloppe, privée de sa frontière, c’est-à-dire 
des points constituant le triangle, est aussi appelée 
/'intérieur du triangle. Le complémentaire de l’enve¬ 
loppe est /'extérieur du triangle. 


7. Trapèze : quadrilatère dont deux côtés au moins 
sont parallèles ('bases du trapèze). 


f{m) = am = — r, donc - f{m) = + r = ma, 
f{n) = an = r' , et mn = r’ + r = \ f(n) - f{m) I 

(les barres signifient qu’on prend la valeur absolue de 
la différence f(n)-f(m), car la distance mn est un 
nombre réel positif, en vertu de la définition générale 
du § a). 

2. a m n : on a aussi mn - I f{n) - f{m) I. 

3. m «s n a : on a aussi mn = I f(n) — f(m) I. 


• Abscisse d’un point sur une droite pointée. Le 
fait de choisir un point a (arbitraire) sur D, et d’orienter 
D par le vecteur directeur ab détermine, pour tout 


point m, l’application : 

f (m ) = nombre réel x = 


d (a , m ) si a < m 

(donc x positif) ; 

< 0 si a = m ; 

- d (a , m ) si m < a 
(donc x négatif). 


Ce nombre réel, positif, négatif ou nul, qu’on peut 
associer biunivoquement à tout point m d’une droite 
pointée s’appelle Vabscisse du point m sur la droite 
pointée (D, a). Il dépend, bien évidemment, du point a 
choisi : l’abscisse d’un point n’est donc pas une pro¬ 
priété intrinsèque de ce point, puisqu’elle est fonction 
du choix d’un autre point (l’origine). 


La relation de Chasles. 

Nous venons de dire que l’abscisse d’un point sur 
une droite pointée n’est pas une propriété intrinsèque 
du point considéré ; demandons-nous s’il n’existe pas, 
sur la droite D, une propriété qui soit intrinsèque, 
c’est-à-dire indépendante de l’origine choisie. 

• Mesure algébrique d’un vecteur. Soit d’abord 
un exemple simple : l’organisateur d’une compétition 
de ski — par exemple d’une « descente » — ne déclare 
pas : « les skieurs partiront de l’altitude 2 500 mètres 
pour arriver à l’altitude 2 000 mètres », mais « les 
skieurs descendront une piste de 500 mètres de 
dénivellation ». L’altitude est une propriété extrinsè¬ 
que : elle dépend de l’origine choisie (le niveau de la 
mer pour les géographes) ; la dénivellation est une 
propriété intrinsèque de la piste, indépendante de 
l’origine choisie. 

Considérons maintenant le bipoint { m 1t m 2 } sur la 
droite pointée D ; on a : 

j abscisse de m 1 = f(m A ) = x 1 ; 

1 abscisse de m 2 = f(m 2 ) = x 2 . (1) 

Le couple m 1t m 2 peut être ordonné : on peut choisir 
d’appeler m 1 l’ origine du couple et m 2 l’ extrémité du 
couple, ce qu’on écrit symboliquement m 2 ; si l’on 
avait fait le choix opposé, on aurait écrit m 2 m v Un 
bipoint ordonné de la sorte s’appelle un vecteur géo¬ 
métrique (on a le droit de l’appeler « vecteur » parce 
que tous ces couples ordonnés forment un ensemble 
qui vérifie les axiomes de la structure d’espace vecto¬ 
riel ; c’est d’ailleurs là un point que nous n’avons pas à 
discuter ici). 

On appelle mesure algébrique du vecteur m^m 2 le 
nombre réel (positif, négatif ou nul) : x 2 — x 1t et l’on 
écrit : 

m! m 2 = f{m 2 ) - f(m,) = x 2 - x^ . (2) 

• Remarque : ne pas confo ndre m 1 m 2 (surli¬ 

gné), qui est un nombre réel, avec m, m 2 (fléché), qui 
est un vecteur (représenté dans cet ouvrage par 
m ! 2 ) : l es lois de composition ( = les opérations) sur 

les réels m, m 2 ne sont pas les mêmes que les lois de 
composition sur les vecteurs m : m 2 , car les deux 
ensembles n’ont pas la même structure. De plus, s i la 
mesure algébrique du vecteur m ] m 2 est m : m 2 , la 
mesure algébrique du vecteur m 2 m^ (vecteur opposé) 
est m 2 m 1 = - m, m 2 . Enfin, le vecteur m 1 /n 1 = 0 a une 
mesure algébrique égale à 0, puisque x 2 = x 1 et que 
X-, x 1 = 0. 

• Exemple concret. Soit deux points a et b tels 
que f(a) = — 1 et f(b) = - 5, on a : 

distance d(a, b) = ab = \ f{b) - f(a) | 

= I — 5 — (— 1) I 
= 1-41=4; (3) 

{ mesure algébrique de ab } = ab = f(b) - f(a) 

= -4; (4) 

{ module du vecteur ab) = d{a, b) = 4 . (5) 

• Relation de Chasles pour trois points. Soit 
trois points m^, m 2 et m 3 sur une droite pointée (D, a). 
On démontre que, quelle que soit la position respective 
des points m,, m 2 et m 3 , on a toujours : 

m 1 m 2 + m 2 m 3 + m 3 m 1 = 0 . (6) 

(L’ extrémité d’un bipoint, par exemple m 2 , est Vorigine 
du suivant.) 
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GÉOMÉTRIE AFFINE DE LA DROITE 

Cette relation s’appelle la relation de Chasles ; elle 
peut aussi s’écrire : 

m i m 2 t m 2 m 3 — m ^ m 3 . (7) 

Examinons les caractères de cette relation. 

— C’est une relation entre les mesures algébri¬ 
ques des bipoints {m 1 ,m 2 }, { m 2 , m 3 } et {m,m 3 }: 
c’est donc une propriété de ces bipoints. 

— Elle est indépendante de l’origine a choisie 
sur D : cette origine, en effet, ne figure pas dans la 
relation ; il s’agit donc d’une propriété intrinsèque des 
points rr?.,, m 2 et m 3 et non d’une propriété extrinsèque. 

Une propriété intrinsèque de ce genre, indépendante 
de l’introduction dans le système de points considérés 
d’une abscisse extérieure à ces points, s’appelle aussi 
une propriété affine. Retenons ce terme, car nous le 
retrouverons bientôt. 

• Relation de Chasles généralisée. Si l’on consi¬ 
dère, sur une droite pointée, n points, on a, de même, 
quelle que soit l’origine choisie et quels que soient 

m -|, m 2 , ..., m n . 

m , m 2 + m 2 m 3 + m 3 m 4 H-h m n m n + m n m, = 0 . (8) 

Structure de la droite. 

Une droite est un ensemble de points qui respecte 
les divers axiomes énoncés jusqu’ici. Pour établir la 
géométrie de la droite correspondant à ces axiomes, il 
faut déterminer quelle est la structure de cet ensemble, 
c’est-à-dire quelles sont les opérations qu’on peut 
appliquer à ses éléments (à ses points). Dans le 
vocabulaire général de la théorie des ensembles, une 
opération qui substitue à deux éléments a et b appar¬ 
tenant à E un troisième élément c du même ensemble 
s’appelle une loi de composition interne ; nous l’avons 
souvent notée « _L ». Lorsqu’on associe à un élément a 
appartenant à E et un élément A (lettre grecque 
lambda) appartenant à un autre ensemble F, un 
élément b appartenant à E, l’opération s’appelle une 
loi de composition externe. 

Si nous transposons ces définitions aux ensembles 
géométriques, dont les éléments sont des points, nous 
allons pouvoir définir sur D deux opérations, l’une 
interne et l’autre externe. 

• Première opération. Considérons, sur une 
droite pointée, deux points m et m' d’abscisses respec¬ 
tives f(m) = x et f(m') = x' et associons à ces deux 
points un troisième point de la droite D, t, tel que 
f(t) = x-F x'. Désignons par « _L » l’opération réalisée 
sur m et m' ; on écrira : 


t = m _L m ', 

( 9 ) 

f(t) = f(m) + f(m') = x -F x' ; 

( 10 ) 


la transformation « _L » est : 

— interne, puisqu’au couple ( m, m') de D elle 
fait correspondre un élément t de D ; 

— commutative : m' _L m définit un point d’ab¬ 
scisse x' + x et x' + x = x -F x' (en vertu des propriétés 
de l’addition des réels) ; donc le point m' _L m est le 
même que le point m _L m' ; 

— associative : m _L (m' _L m") = (m _L m') ± m" ; 

— le point a, origine choisie sur D, a pour 
abscisse f{a) = 0 , donc : 

t = a l m = m ± a, ( 11 ) 

et a est l’élément neutre pour l’opération « _L » ; 

— à tout point m on peut associer un opposé m' 
tel que : 

m±m' = m'±m = a ( 12 ) 

(c’est le point d’abscisse x' = f(m') = — x). 

Ces cinq propriétés de l’opération « _L » permettent 
de dire que l’ensemble D des points m a la structure 
d’un groupe commutatif pour cette opération (voir 
p. 40). Conformément au principe de la notation d’une 
telle opération, nous remplacerons dorénavant « ± » 
par le signe « -F » et nous écrirons : 

m + m' = t, (13) 

m, m' et t désignant des points sur la droite D ; cette 
égalité correspond à l’égalité : 

x + x' — f(t) (14) 

entre les nombres réels x, x' et f(t). 

• Deuxième opération. Considérons l’ensemble 
IR des réels. Pour ne pas confondre ces éléments avec 
ceux de la droite D, nous appellerons : 

a, b, c . I, ... les points de D, 

a, (3, y ,..., A,... les réels de l’ensemble IR. 

Nous ferons une exception de notation, pour sacri¬ 
fier à l’usage, en notant x (et non £) l’abscisse d’un 
point m quelconque sur D. Cela posé, définissons la 
deuxième opération sur D. 


A tout couple ( m, A) d’éléments appartenant respec¬ 
tivement à D et à IR, on fait correspondre un élément de 
D, m', par la relation : 

x' = f(m') = Ax. (15) 

Cette transformation — appelée multiplication par 
un scalaire — sera notée par un point « . » ; on écrira 
donc : 


nommées propriétés affines de la droite. Elles sont 
intéressantes à plus d’un titre (et d’abord en raison de 
leur indépendance). Nous allons donc nous attacher à 
en découvrir d’autres : leur ensemble constitue la 
géométrie affine de la droite ou géométrie affine réelle. 

Milieu d'un bipoint { a, b }. 


A . m = m' (16) 

(il s’agit de la multiplication du point m par le scalaire 
A), mais 

x'= Ax (17) 

(il s’agit de la multiplication de deux scalaires A et x). 

On démontre sans difficulté que cette opération, 
jointe à la précédente, munit l’ensemble D des points 
m d’une structure d’espace vectoriel sur le corps des 
réels (structure décrite p. 46). 

Conclusion. La droite D, en tant qu’espace 
affine, c’est-à-dire non munie d’une origine, n’est pas 
un espace vectoriel ; mais, dès qu’on définit une 
origine sur la droite, c’est-à-dire lorsqu’on attribue à 
chaque point m e D une abscisse, à savoir un nombre 
réel x, la droite D acquiert la structure d’espace 
vectoriel. Ses éléments — les points m — sont des 
vecteurs à une composante (l’abscisse x) ; nous écri¬ 
rons, pour désigner un point m sur une droite : 

soit m, soit m. soit m = x avec x = f(m). 

Le fait que l’espace soit unidimensionnel prête par¬ 
fois à confusion : le calcul sur les vecteurs est en effet 
le même, dans ce cas, que le calcul sur les réels. 
L’étude de la structure du plan — dont la structure de 
la droite n’est qu’un cas particulier — montre bien qu’il 
ne faut pas confondre les deux combinatoires. 


Géométrie affine de la droite. 

En exploitant nos axiomes de base et la bijection qui 
applique D sur IR, nous avons déjà découvert de 
nombreuses propriétés des points d’une droite, c’est- 
à-dire que nous avons commencé à bâtir la géométrie 
de la droite réelle pour le système d’axiomes consi¬ 
déré. Parmi ces propriétés, nous avons vu que certai¬ 
nes étaient intrinsèques : par exemple la mesure algé¬ 
brique d’un segment [m, n], ou la relation de Chasles 
entre plusieurs points m v m 2 , m n ; nous les avons 


On dit aussi : milieu d’un segment [a, b]. 

• Définition. On appelle milieu du bipoint 
{a, b} sur une droite pointée le point m tel que : 

2 m = a + b ( 1 ) 


(attention : nous faisons un calcul sur les points, le 
signe « + » désigne la loi de composition interne 
définie plus haut). Cette relation, rapportée aux abscis¬ 
ses f{m), f(a) et f(b) des points, s’écrit : 


ou 


2 f(m)= f(a) -F f(b), 


f(m) 


_ f(a)+ f(b) 


( 2 ) 

( 3 ) 


• Remarque. La notion de milieu est une notion 
affine, puisque les relations précédentes sont valables 
quelle que soit l’origine choisie. Le lecteur peut s’amu¬ 
ser à faire les vérifications expérimentales indiquées 
sur la figure de la page ci-contre. 


• Une autre façon de s’exprimer. Les deux 
expressions : 

m est le milieu d e {a, b} 
et 

m est le centre de symétrie de {a, b} 

sont identiques par définition. Elles correspondent 
toutes deux à : 


a + b 
m = 2 

pour les points, 

( 4 ) 

nm) = f(a)+ 2 f(b) 

pour les abscisses. 

( 5 ) 


Une autre notion affine : le barycentre. 


• Définition. La notion de milieu fait correspon¬ 
dre, d’une façon affine, à deux points a et b un 
troisième point, m, tel que : 


m 


a -F b 
2 


( 6 ) 


Admirons les cercles concentriques et les 
rayons bien réguliers de cette Diatomée (1), le 2 
prisme hexagonal que constitue un cristal de 
soufre (2), ou les cellules à section hexagonale 
de ce nid de Guêpes (3). Et pourtant ce n’est pas 
l’expérience sensible qui est à l’origine de la 
géométrie, mais l’effort rationnel qui permet 
d’atteindre une vérité par le seul exercice du 
raisonnement. 
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Origine o 


( f ( a ) =-1 

(f(b) = 11 


, f(m) = 


— 1+11 
2 


5 


4 »- ■! -4 4 4 » -I f- l 4 4 I 

a o m o b 


Origine o' 


f’(a) =-10 
f’(b) = + 2 


W = : 


L’abscisse f(m) du point m est indépendante de 
l’origine o choisie. On a indiqué, sur la figure ci-des- 
sus, le calcul dans le cas de deux origines différen¬ 
tes o et o'. En comptant le nombre d’unités séparant 
o ou o' de m, et en affectant le nombre correspondant 
du signe « + » ou du signe « - » selon que m est à 
droite ou à gauche de l’origine, on obtient deux 
abscisses différentes. f(m) = 5 et f'(m) = - 4, mais on 
a, dans les deux cas : 

f(m) = f(a)+f(b) 


« + » désignant une opération sur les points ; en 
remplaçant les points par leurs abscisses, on aurait la 
même égalité. 

Considérons maintenant trois points, a, b et c. On 
peut envisager de leur faire correspondre un point m', 
tel que : 


m' = 


a + b + c 
3 ’ 


( 7 ) 


et, pour n points, a, b, c,..., I, un point g ' tel que: 


9 f = 


a + b + c + •■• + I 
n 


( 8 ) 


Des points teis que m, m' et g ' sont obtenus par des 
relations affines, et g' représente une généralisation de 
m. On peut généraliser encore plus en associant à 
chaque point a un scalaire et en écrivant : 

ol . a + /3. b + ••• + A . / , Q » 

o = -. (y) 

y a + (3 + —+ A 

Dans le cas particulier où il n’y aurait que deux 
points a et b, et en prenant <* = /3=1, on obtient 
g = m. (Rappelons que a . a signifie qu’on passe de a à 
a' = a. a en multipliant l’abscisse de a par a ; le « . » 
est indispensable.) 

Le point g s’appelle le barycentre des points a, b,..., I 
affectés des coefficients a, p, ..., A ; c’est évidemment 
une notion affine. De sa définition, on passe à celle de 
son abscisse : 


f(9) = 


af (a ) + (3f (b ) + ••• + \ f (I ) 
«+£+••• + A 


( 10 ) 


si oc + p + • • • + A 7 ^ 0. 

• Commentaire. Le barycentre d’un ensemble 
de points possède des propriétés remarquables, sur 
lesquelles on se fonde, en géométrie, pour démontrer 
de nombreuses propriétés des figures. L’une des plus 
importantes est la suivante : toute droite quelcon¬ 
que D peut être considérée comme l’ensemble des 
barycentres de deux quelconques, distincts, de ses 
points. Cette propriété conduit à la notion fondamen¬ 
tale de coordonnées barycentriques (voir p. 96). 


Transformations affines. 

Nous avons vu (ci-contre, p. 82) que la droite 
possède une structure d espace vectoriel à une dimen¬ 
sion sur le corps IR des réels, c’est-à-dire qu’on peut 
effectuer sur ses éléments, à savoir les points m 
d’abscisse x, deux opérations : l’ addition et la multi¬ 
plication par un scalaire A. Examinons maintenant ces 
opérations comme faisant correspondre à un point m 
de D un autre point m' de D : on les appelle, dans ce 
cas, des transformations. 

Précisons d’abord notre vocabulaire. Faire corres¬ 
pondre à chaque point de D un autre point de D, c’est, 
en termes d’algèbre, appliquer l’ensemble D dans 
lui-même par l’application D — D, qu’on peut écrire 
aussi, par abus toléré de langage, m—^m'. Le 
point m' sera appelé le transformé de m. 

• Translation du vecteur ab. Soit unvecteur ab 
dont la mesure algébrique sur D est ab = a (a : 
nombre réel). On appelle translation définie par le 
vecteur ab la transformation qui fait correspondre à m 


le point m', tel que mm' = ab. On a, évidemment, 
rnrn' = ab = a. La mesure algébrique d’un bipoint 
{m, m'} étant indépendante de l’origine, la transfor¬ 
mation est une transformation affine. On pourra écrire 
(voir § C, d) : 

x' = x + a. (11) 


Par abus de langage, on écrira aussi parfois : 

m' = m + a . (12) 

Il est facile de démontrer les propriétés suivantes. 

— La composition de deux translations ab et 
cde st équivalente à une translation ab + cd ; elle est 
en outre commutative (le résultat est indépendant de 
l’ordre dans lequel on les effectue) et associative. Nous 
désignerons la composition de deux translations par le 
signe « + ». 

— La translation de vecteur aa = 0 est neutre 
pour la composition : 

translation ab + translation 0 = translation ab 

— A chaque translation ab correspond une 
translation opposée ba : 

translation ab + translation ba = translation 0 = 0. 

Cela montre que les translations forment un groupe 
commutatif. 

• Symétrie de centre a. Soient sur D un point m 
et un point a défini par son abscisse ; le point m' tel 
que a soit le milieu de { m, m'} est le symétrique de m 
par rapport à a (voir ci-dessus, a). La symétrie est aussi 
une transformation affine, puisque la notion de milieu 
est elle-même affine. Si l’on appelle S{m) la symétrie 
qui transforme m en m', la même opération S(m') 
transforme m' en m : on exprime cela en disant que la 
symétrie est une transformation involutive. On notera 
que a est à lui-même son symétrique : c’est le seul 
point invariant de la transformation. 

• Dilatation de rapports Soit A un réel quelcon¬ 
que et a un nombre réel dépendant du choix de 
l’origine. On appelle dilatation de rapport A la transfor¬ 
mation qui fait correspondre à m le point m' de telle 
sorte que les abscisses x et x' de ces deux points 
soient liées par la relation : 

x' = Ax + a. (13) 

— Si A = 0, on a x' = a : tous les transformés de 
m sont confondus au point a d’abscisse a. On dit que 
la dilatation est dégénérée. 

— Si A = 1, on a x' = x + a: l a tran sformation 
est une translation de vecteur oa et mm' = a. 

— Si A n’est ni nul, ni égal à 1, la transformation 
s’appelle une homothétie de rapport A. Il existe alors 
sur D un point et un seul invariant dans la dilatation, le 
point c d’abscisse a/(1 - A) appelé centre d’homothé- 
tie. Dans le cas particulier où A = — 1, l’homothétie se 
réduit à la symétrie de centre c. 

Sur l’ensemble des dilatations, on peut définir une loi 
de composition interne, comme on l’a fait dans le cas 
particulier des translations. On montrerait aisément 
que l’ensemble possède la structure de groupe pour 
cette loi. 

Si l’on démontre une propriété affine sur D, relative à 
des points m, n, p, ..., et si l’on fait subir à D une 
dilatation, transformant m, n, p, ... en m’, n', p', ..., la 
propriété en cause est invariante dans la dilatation. 
Ainsi : 

— Soient deux points a et b, et leur milieu 
m= (a + b)/ 2 ; soit la dilatation f qui transforme a en 
a', b en b' et m en m’. On démontre que 


autrement dit que l’image du milieu de { a, b} est le 
milieu de l’image {a', b'}. 

— Soit un système de points a, b, c, ... affectés 
des coefficients a, p, y, ... et leur barycentre g. L’image 
g' de g est le barycentre des images a', b', c', ... des 
points a, b, c, ... affectées des mêmes coefficients. 

— Etc. 


• Conclusion. Les propriétés affines de la droite 
sont conservées pour toute dilatation : le groupe des 
dilatations est le groupe structurel de la géométrie 
affine de la droite. Il est remarquable que ce groupe 
comprenne les translations, les symétries et les homo- 
théties. Une droite sur laquelle on ne définirait que les 
deux premières transformations ne posséderait que 
des propriétés métriques, c’est-à-dire qu’on pourrait 
dire de deux segments qu’ils sont égaux ou inégaux, 
mais qu’on ne pourrait pas étudier le rapport de leurs 
longueurs. La géométrie métrique est donc subordon¬ 
née à la géométrie affine. Nous verrons, pour le plan, la 
conséquence de cette restriction. 


STRUCTURE DU PLAN 

Structure du plan. 

L’étude des propriétés des figures planes peut se 
faire selon le même principe que celle des figures sur la 
droite. Au lieu d’avoir affaire uniquement à des 
bipoints, à des segments, etc., nous aurons à considé¬ 
rer des secteurs angulaires, des bandes planes, des 
polygones (triangles, quadrilatères, etc.), des courbes 
ouvertes ou fermées, etc. En apparence, le champ 
d’étude semble très vaste. En fait, dans le plan comme 
sur la ligne droite, l’essentiel se ramène à la combinai¬ 
son convenable des ensembles de points dans un 
« calcul géométrique » dont les opérations s’appellent 
translation, symétrie, homothétie, etc. Nous devons 
donc étudier trois problèmes essentiels suivants : 

1 - étudier les opérations fondamentales dans le 

plan ; 

2 - examiner leurs propriétés et en déduire la 
structure du plan relativement à ces opérations ; 

3 - construire, à l’aide de ces connaissances, la 
géométrie affine et la géométrie métrique du plan. 

L’enseignement traditionnel de la géométrie, orienté 
plus ou moins inconsciemment vers les applications 
pratiques, développait surtout le troisième de ces 
problèmes ; nous insisterons surtout, ici, sur les deux 
premiers, de beaucoup les plus larges : une fois ces 
premières difficultés aplanies, s’ouvre alors la voie qui 
débouche sur un lot imposant de connaissances parti¬ 
culières, une voie qui a été débarrassée de tous ses 
obstacles et qui n’est pas très loin d’être — comme le 
souhaitait l’illustre élève d’Euclide si l’on en croit la 
légende — une voie royale. 

Axiome de Thalès. 

• Énoncé. Ajoutons aux axiomes E, I, O, P et D 
dont nous avons déjà fait usage, l’axiome suivant, 
auquel on donne parfois le nom de ce géomètre grec 
célèbre ; nous l’appellerons l’axiome Th. 

Axiome Th : soient trois droites parallèles, A, B et C, 
et deux droites D et D' coupant respectivement ces 
parallèles en a, b, c pour D et a', b ' et c' pour D'. Si b 
est le milieu du segment [a, c], alors b' est le milieu du 
segment [a', c']. Le lecteur est prié de noter que cet 
axiome est tout aussi valable pour un modèle géomé¬ 
trique tel le modèle classique que pour un modèle 
algébrique par exemple. Puisque cet axiome traduit 
une vérité d’expérience, nous pouvons en donner une 
image concrète. 



Image de l’axiome de Thalès. Les droites parallè¬ 
les A, B et C coupent les droites D et D' respective¬ 
ment en a, b, c, a', b', c'. Si b est le milieu du segment 
[a, c], alors b' est le milieu du segment [a', c']. 

• Conséquences. On déduit de l’axiome ' r li le 
très important théorème suivant : 

Théorème : les diagonales d’un parallélogramme se 
coupent en leur milieu, 
et sa réciproque : 

Théorème : si les diagonales d’un quadrilatère se 
coupent en leur milieu, ce quadrilatère est un parallélo¬ 
gramme. 

• Remarque. Quatre points a, b, c, d sur une 
droite définissent un quadrilatère aplati. Si les 
segments [a, c] et [b, d] ont même milieu, le théorème 
précédent est encore valable et l’on dit que le quadrila¬ 
tère est un parallélogramme aplati. On peut déduire de 
cette remarque et de l’axiome Th une importante 
propriété projective du parallélogramme (voir p. 96). 


Structure d'espace vectoriel du plan pointé. 

Nous conserverons, dans le plan n, la définition de la 
symétrie par rapport à un point, donnée à propos de la 
droite : étant donné un point o, choisi à l’avance, et un 
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STRUCTURE DU PLAN 

point quelconque appartenant à n, on appelle symétrie 
l’application de n sur lui-même qui fait correspondre à 
tout m un point m' aligné avec o et m, tel que o soit le 
milieu du segment [m, m']. On peut écrire : 

S(m) = m' ; 

S(o) = o (invariant) ; 

S(m') = m (la symétrie est une opération involutive). 

Ainsi, les sommets d’un parallélogramme peuvent 
être considérés comme symétriques deux à deux par 
rapport au milieu commun des diagonales. 

Cela posé, pour munir le plan n d’une structure 
d’espace vectoriel, il faut y définir deux opérations, 
l’une lui conférant la structure de groupe commutatif 
(nous la désignerons par le signe « + » et nous la 
nommerons « addition », mais ne pas oublier qu’on 
opère sur des points et non pas sur des nombres), 
l’autre sera la multiplication par un scalaire. Nous 
choisirons au préalable dans II un point o que nous 
appellerons origine ; le couple (n, o) sera appelé un 
plan pointé. 

• L’opération addition. 

— Définition : soient deux points m 1 et m 2 du 
plan pointé ; on appelle addition de m, et m 2 l’opéra¬ 
tion qui leur associe le point m = m 1 + m 2 tel que 
(o, m v m , m 2 ) soit un parallélogramme. De par sa 
définition, cette opération est une loi de composition 
interne, puisque m appartient au même ensemble que 
m 1 et m 2 . 



L’opération << addition » dans le plan pointé. La 
construction de m peut se faire de deux manières : 
soit en menant m 2 m // om 1 et m 1 m // om 2 , et en 
prenant l’intersection de ces deux droites, soit en 
prenant le symétrique m de o par rapport au milieu c 
de m 1 m 2 . 

— Propriétés de cette opération. 

1 - C’est une loi de composition interne. 

2 - Elle est définie pour tout couple {m : , m 2 ) : 

dans le cas où o, m 1 et m 2 seraient alignés sur une 
droite D, m serait le sommet d’un parallélogramme 
aplati et, m 2 ] et [o, m] ayant même milieu, c, on 

aurait : 

m^ + m 2 o + m 

c ---= —-—, d’ou m = /77i + m 2 ■ (15) 

Autrement dit, la restriction de l’opération à la droite D 
est identique à Vaddition sur cette droite, et nous 
savons que cette opération confère à la droite (D, o) 
une structure de groupe commutatif. 

3 - C’est une loi commutative : 

m : + m 2 = m 2 +m^ = m, 0 6 ) 

puisque [m v m 2 ] et [m 2 , mj ont même milieu c et que 
m est le symétrique de o par rapport à c. 

4 - On démontre aisément, de même, qu’elle est 
associative (nous ne le ferons pas ici : les démonstra¬ 
tions procèdent toujours de la même façon), c’est-à- 
dire que : 

(m^ + m 2 ) + m 3 = m 1 + (m 2 4- m 3 ). (17) 

5 - On a évidemment 

m 1 + o = o + m, = m 1 , (18) 

donc le point o est l’élément neutre pour cette loi. 
D’autre part, le symétrique m' de m par rapport à o 
vérifie la relation m + m' = m' 4- m = o : tout point m 
admet donc un opposé m' pour la loi en cause. 

Conclusion : l’opération « 4- » confère au plan pointé 
(TI, o) est la somme d’un point m 1 appartenant à D 1 et 

— Remarque. Une droite pointée (D, o) de ce 
plan a la même structure : c’est donc un sous-groupe 
du groupe précédent. Pour tout couple (D v D 2 ) de 
droites distinctes qui se coupent en o, tout point m de 
(n, o) est la somme d’un point m 1 appartenant à D 1 et 
d’un point m 2 appartenant à D 2 : on dit que le groupe 
(TI, o) est la somme des sous-groupes (D 1t o) et (D 2 , o). 
Le couple (D v D 2 ) ainsi défini s’appelle un repère dans 
n (figure ci-après). 



Repère dans le plan TT. 

L ’opération a + b = m est figurée en traits fins 
noirs. On peut aussi prendre D 1 et D 2 comme repères. 
Dès lors on a : a = a, + a 2 et b = b 1 4 b 2 (traits 
noirs interrompus). Et m = a 4 b devient 

m = a, 4 b, + a 2 + b 2 ; mais on a aussi m - m, 4 m 2 
(en bleu), donc m, = a^ 4 b^ et m 2 = a 2 + b 2 . 


• Multiplication par un scalaire. 

— Définition. Soit m un point du plan (TI, o) et 
soit A un scalaire appartenant à l’ensemble R des réels. 
A tout couple (A, m) on associe un point unique m' de 
(II, o) noté : 

m' = A . m. (19) 



L’opération multiplication par un scalaire dans le 
plan. 

On est parti d’un même point m. Remarquer le cas 
A = - 1 : le point m" obtenu est le symétrique de m 
par rapport à o. 


— Propriétés de cette opération : 

1 - C’est une loi de composition externe. 

2 - On a évidemment 1 . m = m. 

3 - Quels que soient les scalaires A et p on a 
toujours : A . (p . m) = (A p) .m. 

(Attention : est une multiplication dans le corps 

des réels ; A . m est l’opération particulière envisagée 
ici sur le point m.) 

4 - Quels que soient A et p on a : 

(\ + p).m = \.m + /jL.m. (20) 

5 - Quels que soient les points m et n, on a : 

A . (m + n) = A . m 4 A . n. (21) 

Les quatre premières sont immédiates. La cinquième 
se déduit d’un théorème important concernant la 
linéarité de la projection oblique du plan. Considérons 
un point m quelconque de (II, o) et une droite D 
passant par o ; la projection oblique du plan n sur la 
droite D, parallèlement à une direction 8 distincte de 
celle de D, s’obtient en menant de m la parallèle à 8 et 


Projection oblique d’un point m du plan sur D. 



en prenant son intersection m' avec D. On peut écrire, 
en désignant par f cette projection : 

m' = f(m) (22) 

et 

n— 

Considérons maintenant, dans le plan pointé, une 
droite passant par o et une direction 8. Appliquons au 
point m la transformation A . m qui donne le point 
m 1 = A . m. Si l’on projette m et A . m sur la droite D, 
parallèlement à la direction 8 , on obtient deux points, 

m' = f(m) et m\ = f (A . m) (23) 

et l’on peut démontrer (ce que nous ne ferons pas ici, 
bien que la démonstration soit élémentaire), que, pour 
tout A appartenant à l’ensemble des réels : 

m\ = A . m ' (24) 



c’est-à-dire que, si m et m 1 se déduisent l’un de l’autre 
par une opération linéaire (multiplication par un sca¬ 
laire), leurs projections obliques sur D entretiennent la 
même relation. Cela s’écrit encore : 

f(\ . m) = A . f(m). (25) 

Si nous traduisons ce théorème par une image, nous 
reconnaîtrons dans la linéarité de la projection oblique 
(figure ci-dessus) une propriété bien connue des collé¬ 
giens sous le nom de théorème de Thalès (« des 
droites parallèles découpent sur des sécantes quelcon¬ 
ques des segments proportionnels »). 

• Conclusion. Le plan (II, o), muni des deux lois 
de composition précédentes, possède donc la struc¬ 
ture d ’espace vectoriel. Chaque point m de cet ensem¬ 
ble est un vecteur (au sens de la page 47). Or nous 
avons vu plus haut qu’un point m pouvait être consi¬ 
déré comme la somme de deux points m -i et m 2 (voir : 
repère dans le plan pointé). Choisissons donc deux 
droites quelconques D-i et D 2 , passant par o, et deux 
points ai et a 2 sur ces deux droites. On a toujours : 

m = A . a., + p . a 2 (A, p : réels). (26) 

Les vecteurs (points) et a 2 forment une base pour 
l’espace vectoriel considéré (le plan pointé) ; A et p 
s’appellent les coordonnées (composantes) de m par 
rapport à cette base : ce sont des nombres entiers ou 
fractionnaires, positifs ou négatifs, rationnels ou irra¬ 
tionnels. On peut écrire indifféremment : 

le point m, m, m = | A | p | , m = A . a 1 + /jl . a 2 . 

Le plan (II, o) est un espace vectoriel à deux dimen¬ 
sions. 

Géométrie affine du plan. 

• Définition. On pourrait définir les propriétés 
affines du plan comme on l’a fait pour la droite, en les 
considérant comme des propriétés indépendantes du 
choix de l’origine o (cela nous conduirait à utiliser la 
notion de barycentre). On préfère se servir de la 
définition suivante (équivalente) : On appelle transfor¬ 
mation affine du plan Tl toute transformation qui fait 
correspondre toute droite orientée D à une droite 
orientée D'. 

• Translation et homothétie dans le plan. Les 
lois de composition étudiées plus haut {b) permettent 
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GÉOMÉTRIE AFFINE ET MÉTRIQUE DU PLAN 


de définir — comme sur la droite — les deux transfor¬ 
mations appelées translation abe t homothétie de cen¬ 
tre o et de rapport k, qui sont toutes deux des transfor¬ 
mations affines. 

— Translation ab : c’est la translation qui à tout 
point m du plan fait correspondre un point m' tel que 
mm = ab. Pour les propriétés de la translation, voir 
à la p. 147. 

— Homothétie de centre o et de rapport k : 
c’est la transformation qui à tout point m du plan fait 
correspondre un point m' tel que om’ = kom 

Pour les propriétés de l’homothétie voir à la p. 147. 

• Autres transformations affines élémentaires. 
Le lecteur est prié de se reporter p. 147, où ces 
transformations sont étudiées. 


Géométrie métrique du plan. 

• Axiome de l’inégalité triangulaire (axiome 1). 
Cet axiome, propre à la géométrie euclidienne, traduit 
une expérience physique commune. Étant donné dans 
n un tripoint {a, b, c} quelconque, a, b et c n’étant 
pas alignés, on a toujours : 

d(a, c) < d(a, b) + d{b, c) , (27) 

d(a, c), etc. désignant les distances des points, a et c, 
a et b et b et c. Autrement dit, à tout couple m et n de 
points du plan, on peut faire correspondre un nombre 
réel d vérifiant les axiomes D 2 et D 3 énoncés plus haut 
et l’axiome Th précédent. On dit alors que le plan est 
un espace métrique. La géométrie métrique de n sera 
l’étude des propriétés des figures qui restent invarian¬ 
tes dans un groupe de transformations lié à cette 
notion de distance. 

• Isométrie. On appelle isométrie une transfor¬ 
mation qui conserve les distances, ou, plus rigoureuse¬ 
ment, une application f de A dans n, A étant une partie 
de n, telle que, pour tout bipoint {a, b} de A, on ait : 

d(a, b) = d[f(a),f(b)]. (28) 

Un exemple d’isométrie est donné par la translation, 
qui fait correspondre à une figure F du plan une 
figure F'égale à la figure F. Un autre exemple nous est 
donné par la rotation d’un angle 6 autour d’un cen¬ 
tre o (voir p. 147). 

• Axiome de symétrie (S). Si l’on trace une 
figure sur une feuille de papier et que l’on plie ensuite 
cette feuille suivant une droite D (charnière), chaque 
point m de la figure primitive s’applique en un 
point m' de la partie de la feuille sur laquelle on a replié 
la figure : cette opération s’appelle un retournement. 
On traduit cette expérience banale (qui conduit à 
considérer deux figures égales mais non superposa¬ 
bles par glissement) par l’axiome de symétrie : 

Pour toute droite D de n, il existe au moins une 
isométrie du demi-plan fermé (D, .) sur son demi-plan 
symétrique (., D), telle que pour tout point m de D on 
ait f(m) = m. Toute isométrie possédant cette propriété 
est appelée pliage autour de D (voir fig. ci-après). 

En s’appuyant sur les axiomes métriques du plan, on 
démontre que ce pliage est unique pour une droite 
donnée. 

Nous trouverons plus loin (e) les conséquences 
importantes de ce théorème. 

Perpendiculaires et obliques. 

L’axiome de symétrie affirme l’existence d’une iso¬ 
métrie par pliage d’un demi-plan sur un autre autour 
d’une charnière D. Soit a et a' deux points se corres¬ 
pondant de la sorte. Nous pouvons écrire a' = f(a), en 
appelant f le pliage autour de D. Il est facile de 
démontrer que le milieu a du segment [a, a'] est sur D, 
ce qui permet d’énoncer les propriétés suivantes relati¬ 
ves à la symétrie et aux droites perpendiculaires. 

• Symétrie. 

— Etant donné, dans le plan II, un point quel¬ 
conque m et une droite D, on appelle projection 
orthogonale de m sur D le milieu unique p du segment 
\m, m '], m' étant obtenu à partir de m par pliage 
autour de D (ce milieu est unique, car on démontre 
qu’il n’y a qu’un pliage autour de D). Si m est sur D, il 
coïncide avec sa projection orthogonale. Lorsqu’il ne 
peut y avoir de confusion avec une projection oblique, 
on dit, par abus de langage, que p est la projection de 
m sur D. 

(Remarque : en géométrie classique on définit la 
projection orthogonale d’un point sur une droite 
comme le pied de la perpendiculaire abaissée de ce 
point sur la droite considérée.) 

— A tout point n de n, on peut faire correspon¬ 
dre son symétrique n' par rapport à sa projection 
orthogonale sur une droite D quelconque. Cette cor¬ 


respondance s’appelle symétrie par rapport à D (ou : 
symétrie d’axe D) : c’est une application s de n dans 
n. On a donc : 

m' = f(m) = s(m) et m = f \m') = s(m'). (29) 

Et l’on démontrerait aisément que toute symétrie est 
une isométrie. 



/ - Pliage d’un demi-plan sur un autre autour d’une 
charnière D. 

II - m' et n' sont symétriques de m et n par rapport 

à D. 


• Droites perpendiculaires. Soit une droite A ; 
pour déterminer sa symétrique A' par rapport à une 
droite D, on détermine les symétriques de deux de ses 
points a et b (figure ci-dessous). Il peut se trouver que 
A et A' soient confondues : on dit, dans ce cas, que la 
droite A est perpendiculaire à la droite D et l’on écrit : 

A J_ D (lire : « delta perpendiculaire à D »). 



Symétrique d’une droite A par rapport à une char¬ 
nière D. 

I - A est quelconque , distincte de sa symétrique A'. 

II - A est confondue avec sa symétrique A' : on dit 
que A est perpendiculaire à D. 


Il résulte de ce qui précède les théorèmes suivants : 

— Si A ± D, tout point de A se projette sur D en 
a (figure ci-dessus). 

— Si A _L D, et si f est une isométrie quelcon¬ 
que, alors f(A) _L f(D). 

— Si A _L D, alors D _L A. 

— Si A ± D, les affirmations D JL X et A // X 
sont équivalentes. 

— Par un point m de n, il passe une perpendi¬ 
culaire et une seule à une droite D (ce théorème est 
une conséquence du précédent et de l’axiome 
d’Euclide). 

• Médiatrices. Soit un bipoint {a, b} de 
milieu o : on appelle médiatrice de { a, b} la perpendi¬ 
culaire menée de o à la droite D(a, b). La propriété la 
plus importante de la médiatrice d’un bipoint est la 
suivante : la médiatrice d’un bipoint { a, b} est l’ensem¬ 
ble des points équidistants de a et de b. 


Vecteurs et vecteurs géométriques 
dans le plan. 

Rappel des définitions. 

Les vecteurs géométriques sont des vecteurs parti¬ 
culiers, qui présentent l’avantage d’être représenta b les 
par une figure (une petite flèche). Pour opérer sur ces 
vecteurs, on peut procéder de deux façons : 

— soit géométriquement, en traduisant par des 
constructions géométriques les opérations fondamen¬ 
tales ; 

— soit analytiquement, en opérant uniquement 
sur leurs composantes (qui sont, on le sait, des nom¬ 
bres réels). 

Nous allons préciser ici l’aspect géométrique de ce 
calcul vectoriel particulier, en nous plaçant dans un 
plan pointé (n, o). 

• Un vecteur ab dans le plan est un couple 
ordonné de points dont le premier est nommé Vorigine 
et l’autre Vextrémité. C’est une notion qui correspond à 
trois déterminations géométriques : une direction a, 
un sens sur cette direction, et une grandeur qui 
représente la distance d(a, b) entre les deux points. 
Cette grandeur est appelée le module ou la norme du 
vecteur ab, et l’on écrit : 

I ab I ou Il ab || = norme du vecteur ab. (1) 

La norme d’un vecteur, c’est-à-dire le symbole || ab ||, 
est un nombre essentiellement positif. 

• Deux vecteurs ab et a b sont dits équipol- 
lents s’ils se correspondent mutuellement par une 
translation du plan n. On écrit alors : 

ab^ab (2) 

la relation « = » étant une relation d’équivalence. 
L’ensemble de tous les vecteurs a b' équipollents à un 
vecteur donné ab, c’est-à-dire tels que abb' a' soit un 
parallélogramme, est une classe d’équivalence pour 
cette relation ; on l’appelle un vecteur libre, et on la 
désigne souvent par le vecteur particulier (vecteur lié) 
ab auquel sont équipollents tous les vecteurs de cette 
classe. 

• Base. Si l’on considère, dans le plan (II, o), 
deux droites quelconques passant par o, x' oxet y' oy , 
orientées respectivement par un vecteur u et par un 
vecteur v, tous deux d’origine o et de norme égale à 
l’unité (vecteurs unitaires), ce couple de vecteurs 
constitue une base pour l’ensemble des vecteurs du 
plan. Un vecteur ab quelconque est une combinaison 
linéaire de ces deux vecteurs unitaires : 

ab=\u+pv (X et p : réels). (3) 

Les nombres A et p sont les composantes du 
vecteur ab. 

Opérations sur les vecteurs (dans le plan). 

• Addition. Analytiquement, la somme 

ab( A, p) + cd(\', p') (4) 

doit s’entendre comme portant sur les classes d’équi¬ 
valence ab et cd ; on obtient le vecteur libre 
af( A + A', p + p'). Géométriquement, on mène d’un 
point arbitraire o (qui peut être l’origine du repère) des 
vecteurs équipollents à ab et cd, et l’on construit le 
parallélogramme qui a pour côtés consécutifs ces deux 
vecteurs. La diagonale, issue de o, de ce parallélo¬ 
gramme est la somme vectorielle cherchée. 

Il résulte de cette définition de la somme vectorielle 


Addition des vecteurs. 

On a mené ôm = âB et on = cd* ; la diagonale or est 
la somme (au sens vectoriel) om* + cm* 
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une importante propriété. Soit un vecteur ab et une 
origine quelconque ; on démontre aisément que : 

ab=ob-oa (5) 

(relation de Chasles pour les vecteurs). 

• Multiplication par un scalaire. Analytique¬ 
ment, la multiplication k . ab, k étant un réel et ab un 
vecteur de composantes A et p, revient à multiplier ces 
deux composantes par k, d’où le vecteur a' b' {k\, kp). 
Géométriquement, cela revient à faire subir au vecteur 
ab une homothétie de centre a, par exemple, et de 
rapport k, ce qui donne un vecteur ab' = k . ab 

Donc, d’une manière générale, deux vecteurs ab et 
cd ayant même direction (c’est-à-dire portés par une 
même droite ou par des droites parallèles) se corres¬ 
pondent dans l’homothétie : 

ab=k.cd (k : réel). (6) 

ab et cd sont dits colinéaires, et k est leur rapport de 
colinéarité (il est positif si ab et cd ont même sens, 
négatif s’ils sont de sens contraires). 

Rapport de projection. 

• Définition. Considérons une droite D et effec¬ 
tuons la projection orthogonale de D sur une droite A 
qui coupe D en o : D > A. Le point a, tel que 5â = 1, 
devi ent f(a) = a'. Un point quelconque m de D est tel 
que om = A . oa = A (A : nombre réel), et l’on peut 
écrire m = A . a ; la projection de m sur A est 
m' = f(m) = f {A . a). Si l’on applique le théorème de 
Thalès, en considérant que la projection orthogonale 
est un cas particulier de la projection oblique (le cas où 
la direction de projection est perpendiculaire à A), on 
a : 

f(m) = f(\ . a) = A . f(a) ou encore om ' = A . oa'. (7) 

On peut donc écrire, quel que soit m sur D : 

om ' A . oa' oa' _ _ 

- =-= = = oa ' (puisque oa = + 1 ) ; (8) 

om A . oa oa 

oa', pour la projection considérée, a une valeur 
constante k, qu’on appelle rapport de projection de D 
sur A et qu’on note c(D, zi). On a donc, pour tout point 
m qui se projette en m' : 

om' = k . om . (9) 



orientée A. 

I - D est quelconque. 

II - D est perpendiculaire à A : les points o et a' 
sont confondus, oa' =0 et c(D, A) = 0. 

• Propriétés du rapport de projection. 

— Si D est perpendiculaire à A, le point a' se 
confond avec o et k = oa' = 0 ; il est donc logiquement 
équivalent d’écrire « D _L A » ou « c(D, A) = 0 ». 

— Si D et D' sont deux droites orientées quel¬ 
conques, se coupant en o, on démontre que 

c{D', D)= c(D, D'). (10) 

— D’une façon générale, toute transformation 
qui conserve la perpendicularité et les distances 
conserve aussi le rapport de projection. 

• Remarque : le rapport de projection sera iden¬ 
tifié, p. 90, avec le cosinus de l’angle des droites D 
et A. 

Le produit scalaire. 

• Définition. Soient deux points m et n dans un 
plan pointé (II, o) ; on peut associer à tout couple 
{m, n) un nombre réel p appelé produit scalaire de m 
et de n, défini comme suit : 

p = \\m\\.\\n\\.c(M, N), (11) 


M et N étant les droites reliant l’origine o du plan 
pointé respectivement à m et n, orientées de o vers m 
et net c{M, N) le rapport de projection de M sur N, soit 
cos (M, N). 

On note le produit scalaire par le signe « . », placé 
entre les deux points m et n : 

p = m . n . 



C’est un nombre réel p, associé à deux points m et 
n du plan (Tl, o). On a pris ici : 

Il rn || = 4 , || n || = 2 . 

V3 

c{M, N) = -— ( = cos 1 20°), 

d’où 

( r 

m . n = p = 4x2x1 — ~ I = - 4 V3 = - 6,928 . 


• Remarque. Les points m et n sont des élé¬ 
ments vectoriels (au sens général) ; on peut les rempla¬ 
cer par les vecteurs géométriques omet on, et écrire, 
indifféremment : 

soit p = m.n, soit p = om. on 

Si m et n sont confondus (m= n ou om = on ), on 
écrit, conventionnellement : 

m.m = m 2 ou om. om = om 2 {carré scalaire) (12) 

(le trait au-dessus de m ou de om ne doit pas être 
confondu avec le surlignement qui caractérise la 
mesure algébrique d’un segment: c’est une notation 
conventionnelle liée uniquement au produit scalaire). 

• Propriétés du produit scalaire. 

1 - Si l’un des deux points coïncide avec 
o, p = 0. 

2 - Si M JL N, c{M, N) = 0 et p = 0. 

3 - Quels que soient les points a, b, c dans 
(II, o) et quel que soit le nombre réel k, on a : 


Propriétés 

Notation en 
points 

Notation en vecteurs 
géométriques 

Commutati¬ 

vité 

a . b = b. a 

oa.ob = ob.oa 

Associati¬ 

vité par rap- 
port à la 
multiplica¬ 
tion par un 
scalaire 

{k . a) . b 
= k .{a . b) 

(k .oa).ob 
= k .{oa . ob) 

Distributi- 
vité par rap- 
p o r t à 
l’addition 
(vectorielle) 
dans (II, o) 

a .{b + c) 

= a . b + a . c 

oa. {ob + oc) 

= oa.ob + oa oc 

Inégalité de 

Schwarz 

1 a • t> 1 s || a ||. || b || 

1 oa.ob\ ^ || oa ||. || oA|| 


(L’égalité ne peut avoir lieu que si o, a et 
b sont alignés.) 


Attention : a . b est un produit scalaire, c’est-à-dire un 
nombre réel positif, négatif, ou nul, tandis que | a. b \ 
désigne sa valeur absolue ; par contre, || a ||. || b || est le 
produit arithmétique de la norme de a (mesure géomé¬ 
trique de oa) par la norme de b (mesure géométrique 
de ob). 

4 - Le produit scalaire est invariant dans toute 
isométrie de TI qui conserve le point o. 

• Théorème de Pythagore. Considérons un tri- 
point {a, b, c} dans le plan n et choisissons le point a 
comme origine dans ce plan. Nous avons les égalités 


vectorielles suivantes, en appelant d le quatrième 
sommet du parallélogramme construit sur ab et ac, b' 
le symétrique de b par rapport à a et d'le symétrique 
de d par rapport à c : 

ab + ac = ad, (13) 

ac+ ab = ac - ab = ad = bc, (14) 

bc 2 = {ac - ab ). {ac - ab) 

= ac 2 + ab 2 - 2 . ab. ac (15) 
(distributivité du produit scalaire). 



Le triangle (abc) est supposé quelconque, d’où la 
relation générale : 

bd = a\d + ad - 2 . ab . âc. 

Si ab 1 âc, on a la relation de Pythagore : 

bd = ad + ad. 


— Si le triangle abc est rectangle en a, cela 
signifie que ab _L ac, donc que ab. ac = 0 (propriété 
n° 2 du produit scalaire), d’où : 

bc 2 = ac 2 + ab 2 . (16) 

Ce qui s’énonce : 

Dans un triangle rectangle, le carré de l’hypoténuse 
est égal à la somme des carrés des côtés de l’angle 
droit {théorème de Pythagore), démontré en géomé¬ 
trie classique par référence aux triangles semblables ; 
voir aussi p. 145. 

— Inversement, si bc 2 = ac 2 + ab 2 , cela signifie 
que 2. ab .ac — 0, donc que ab _L ac, donc que le 
triangle abc est rectangle en a {réciproque du théo¬ 
rème de Pythagore). 

De la géométrie plane 
à la géométrie dans l'espace. 

Nous ne traiterons pas, ici, la géométrie dans 
l’espace, dont les principaux résultats sont résumés 
pp. 143-146. Nous nous limiterons à quelques remar¬ 
ques d’ordre général. 

Structure vectorielle de « l'espace ». 

• L’« espace ». L’expérience quotidienne nous 
montre qu’il existe, « au-dessus » et « au-dessous » du 
plateau d’une table supposée prolongée à l’infini dans 
toutes les directions, des points dont l’ensemble 
constitue ce qu’on appelle communément l’espace. 
Les propriétés des figures dans l’espace font l’objet de 
la stéréogéométrie ou géométrie dans l’espace. Il est 
évident que cette nouvelle théorie, plus large que la 
géométrie plane, dépend des axiomes qui seront choi¬ 
sis comme point de départ ; nous admettrons, ici, qu’ils 
traduisent notre expérience commune, ce qui nous 
conduit à la géométrie euclidienne dans l’espace, dont 
on donne, usuellement, deux modèles : 

— Le modèle géométrique, où les figures ont 
pour images ce qu’on appelle habituellement des 
volumes ou des solides (dièdres, trièdres, polyèdres, 
corps ronds, etc.). 

— Le modèle analytique, où les figures sont des 
équations (voir p. 93). 

• L’espace usuel est un espace vectoriel. Les 
points m de l’espace (au sens commun) sont des 
vecteurs (au sens général) à trois dimensions x, y et z. 
Si l’on choisit une droite orientée ox dans l’espace et le 
trièdre direct oxyz (voir p. 93), à chaque point m on 
peut faire correspondre un vecteur om de compo¬ 
santes A, p et v, qui sont trois nombres réels. Toute 
opération sur le point m (ou sur le vecteur om) se 
traduit analytiquement par des opérations algébriques 
élémentaires sur les composantes de m (de om). 

Comme la ligne droite, comme le plan, l’espace du 
géomètre est un ensemble possédant la structure 
d’espace vectoriel (le mot « espace » n’ayant pas, ici, le 
même sens que dans la première partie de la phrase), 
c’est-à-dire qu’on peut y définir les deux opérations 
d addition vectorielle (règle du parallélogramme) et de 
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multiplication d’un vecteur par un scalaire, comme on 
l’a fait pour le plan. Les trois composantes des vecteurs 
spatiaux étant des nombres réels, on peut préciser qu’il 
s’agit d’un espace vectoriel R 3 sur le corps R. 

Le produit vectoriel. 

Nous allons définir ici sur les vecteurs spatiaux une 
loi de composition interne qui trouvera des applica¬ 
tions importantes en géométrie analytique et en 
analyse. 



sentent respectivement les produits vectoriels 

om x on = ôv on x om = ov r> = - ôv. 


• Définition. Soient deux vecteurs omet on de 
l’espace dans lequel une base est choisie une fois pour 
toutes ; on peut leur associer un troisième vecteur, ov, 
ainsi défini : 

— sa direction est perpendiculaire au plan 

{om, on) , 

— son sens sur cette direction est tel que le 
trièdre om, on, ou soit direct (traduction physique : un 
tire-bouchon tournant dans le sens de om vers on pro¬ 
gresse dans le sens de ou ) ; 

— sa norme est le nombre qui mesure la sur¬ 
face du parallélogramme construit sur om, on 

Ce vecteur ovest appelé produit vectoriel de om par 
on , et l’on écrit : 

ou = om xon (1) 

(le signe « x » se lit : « multiplié vectoriellementpar» ; 
on utilise parfois le signe « a » pour indiquer le produit 
vectoriel, mais cet usage n’est plus recommandé 
actuellement). 

• Propriétés. 

1 - C’est une loi de composition interne, 
puisqu’elle fait correspondre à deux vecteurs de 
l’espace un troisième vecteur de l’espace (c’est donc 
une opération très différente de la multiplication par un 
scalaire ou du produit scalaire). 

2 - Le produit vectoriel n’est pas commutatif, 
puisque l’on tient compte du sens du trièdre om, on, 
ou. On aura donc (voir figure ci-dessous) : 

om x on = - on x om (2) 

3 - Le produit vectoriel est distributif par rapport 
à l’addition vectorielle : 

om x {oa + ob) = om x oa + om x ob (3) 


La géométrie projective. 

Nous nous proposons d’étudier maintenant les pro¬ 
priétés des figures qui restent invariantes par un autre 
groupe de transformations appelé le groupe projectif. 
Un exemple simple (et particulier) de ces transforma¬ 
tions est donné par la projection d’une figure parallèle¬ 
ment à une direction donnée sur une droite du plan 
(voir p. 83) : un parallélogramme abcd est alors 
transformé en une série de quatre points alignés a' b' 
c f d 'formant un parallélogramme aplati, tel que a' b ' 
et c' d 'aient le même milieu o', projection de o, point 
de concours des diagonales du parallélogramme abcd. 


Théorème fondamental de la géométrie projective. 

• Énoncé. Supposons qu’on projette, dans le 
plan, tous les points d’une ligne A sur une ligne B, 
puis ceux de B sur C, et ainsi de suite jusqu’à une 
ligne K. Dès lors, à chaque point a de A correspond 


STRUCTURE VECTORIELLE DE L'ESPACE 


biunivoquement un point k de K: cette correspon¬ 
dance est dite projective ; on peut la noter par le 
symbole « 7\ » et l’on écrit : a 1 â /c 1 , par exemple ; K est 
la projection de A selon la transformation considérée. 

Le théorème fondamental de la géométrie projective 
consiste à affirmer que, si l’on connaît les projections 
/q, k 2 , k 3 de trois points distincts a 1t a 2 , a 3 appartenant 
à une droite A, alors le transformé k , d’un point 
quelconque a, de A peut être déterminé sans ambi¬ 
guïté sur K. 

• Points à l’infini. En géométrie élémentaire, ce ^ 
théorème devrait comporter une restriction, due à ■§ 
l’existence des droites parallèles. Soit par exemple la J 
transformation projective qui fait correspondre à tout ^ 
point a de A un point k sur K déterminé par l’intersec- J 
tion de la droite ao avec la droite K, o étant un point? 
fixe caractérisant la transformation. Il est clair que le ^ 
point a 0 de A, tel que a 0 o soit parallèle à K n’a pas de @ 
transformé k 0 sur K, puisque a 0 o ne rencontre pas K. S 
Cette circonstance enlève de sa généralité au théo- g 
rème fondamental et il risque d’en résulter, dans la ^ 
suite des raisonnements, des complications et des.* 
discussions qu’on peut éviter en introduisant la notion | 
de point à l’infini {point idéal) sur une droite : à chaque '■§ 
droite D associons (axiomatiquement) un point 8 * 
appelé point à l’infini, tel que (toujours axiomatique- g. 
ment) toute droite parallèle à D passe par 8 (autrement -s 
dit, considérons que deux droites parallèles se rencon-1 
trent à l’infini). Dès lors, dans le cas présent de la 5 
transformation examinée, a 0 o, étant parallèle à la 
droite K, coupe cette droite en son point à l’infini k 
(lettre grecque : kappa). A partir de cette notion de 
point à l’infini, introduite par le géomètre français 
Desargues (1593-1662), on peut définir: 

— la droite à l’infini d’un plan comme l’ensem¬ 
ble de tous les points à l’infini correspondant à toutes 
les droites du plan considéré ; 

— le plan à l’infini d’un espace à trois dimen¬ 
sions (notre espace euclidien usuel) comme l’ensem¬ 
ble de tous les points à l’infini de toutes les droites de 
cet espace. 

• Avantage de cette notion. Considérons, en 
géométrie euclidienne classique, la propriété élémen¬ 
taire suivante : 

« Dans un plan, deux droites distinctes ont en 
commun un point et un seul ou bien sont parallèles au 
sens strict ». 

Cette proposition devient, en géométrie projective : 

« Dans un plan, deux droites distinctes ont en 
commun un point et un seul ». 

La deuxième partie de l’alternative n’a plus de raison 
d’être puisque, si elles sont parallèles, elles ont en 



Jean-Victor Poncelet (1788-1867) : prisonnier des 
Russes, en 1812, à Saratov, au cours de la campa¬ 
gne de Russie voulue par l’orgueil napoléonien ; ce 
général-mathématicien a mis à profit sa captivité 
pour inventer une nouvelle géométrie en rapport 
avec les propriétés projectives des figures. 


commun leur point à l’infini ; la proposition projective 
est plus brève, plus simple, plus générale que la 
proposition euclidienne, qui était composée, en fait, de 
deux propositions reliées par la conjonction ou bien. 

Le principe de dualité. 

Considérons la proposition suivante, connue sous le 
nom de théorème de Pappus (voir figures page sui¬ 
vante) : 

« Soient deux droites D et D' dans un plan, trois points 
a, b et c sur D, trois points a', b' et c' sur D'. Les trois 
points d’intersection de (ab' et ba’), (ac' et ca'), (bc' et 
cb') appartiennent à une même droite D" (= sont 
alignés) ». 


La géométrie des 
polyèdres réguliers a 
fasciné les grands 
artistes de la Renais¬ 
sance, comme Paolo 
Ucello, Durer ou Léo¬ 
nard de Vinci. Le 
graveur néerlandais 
M. C. Escher a été 
sensible à leur mys¬ 
tère (ils symbolisent, 
dit-il, notre désir d’har¬ 
monie et d’ordre) et l’a 
traduit par des gravu¬ 
res du genre de celle- 
ci, intitulée Planétoïde 
tétraédrique (1954). 
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GÉOMÉTRIE PROJECTIVE 

Considérons ensuite la proposition suivante : 

« Soient deux points d et d'dans un plan, trois droites 
A, B, C passant par d, trois droites A', B', C' passant par 
d'. Les trois droites joignant les intersections de (A et 
B', B et A ), (A et C', C et A'), (B et C\ C et B’) passent 
par un même point d"(- sont concourantes) ». 

On passe d’un théorème à l’autre en remplaçant le 
mot « droite » par le mot « point », les minuscules par 
des majuscules, les majuscules par des minuscules, et 
l’expression « sur » ou « appartient à » (une droite) par 
« passant par » (le point). Ces deux propositions sont 
dites duales l’une de l’autre, et le principe de cette 
correspondance s’appelle le principe de dualité. Si l’on 
définit une transformation géométrique munie de cer¬ 
taines propriétés qui fait correspondre à tout point a 
une droite A et à toute droite D un point d, on peut 
assurer que la validité de l’une de ces deux proposi¬ 
tions entraîne celle de l’autre et réciproquement. 

L’intérêt du principe de dualité, exploité par Poncelet 
( Journal für Mathematik, 1829), Gergonne ( Annales de 
Mathématiques pures et appliquées, 1825-1827) et 
généralisé par Steiner (1832), est de multiplier par 
deux, comme par un jeu de miroirs, les connaissances 
géométriques. 


Faisceaux de droites. 

• Correspondance projective entre deux fais¬ 
ceaux de droites. Revenons un instant sur l’exemple 
du début. A chaque point a v a 2 , ..., d’une droite A, 
nous avons associé, à partir d’un point o fixe extérieur 
à cette droite, des droites oa v oa 2 , ... Cette correspon¬ 
dance s’appelle une perspective à une dimension ; 
l’ensemble des droites oa 1t oa 2 , ... est un faisceau de 
droites, le point o est le centre du faisceau. 

— Considérons une perspective particulière 
associant oa 1 à a 1f oa 2 à a 2 , ... ; le faisceau des droites 
oa ( peut être coupé par une droite B quelconque et il 
existe entre les points a 1( a 2 , ... et les points b v b 2 , ... 
une correspondance projective. 

— Menons ensuite, par b v b 2 , ... des droites 
parallèles à A : ce faisceau de droites (dont le centre 
est à l’infini) est en correspondance : 1° avec les points 
b v b 2 , ..., 2° avec les points a 1t a 2 , ..., 3° avec le 
faisceau oa v oa 2 , ... Ces correspondances sont toutes 
de type projectif. 

— Soit maintenant une troisième droite C du 
plan ; elle coupe le faisceau des droites parallèles en 
c 1t c 2 , ..., points qui sont en correspondance projective 
avec les points a v a 2 , ..., les points b 1f b 2 ,..., les droites 
oa : , oa 2 , ..., et ainsi de suite. Et si nous considérions un 
point o' et le faisceau o' c A , o' c 2 , ..., il serait, lui aussi, 
pn correspondance projective avec tous ces ensembles 

tels que les points a 1t a 2 , ..., ou le faisceau oa 1f oa 2 . 

et ainsi de suite. 



Correspondances projectives. 


• Les coniques. Considérons deux faisceaux 
projectifs distincts, oa^ oa 2 , ... et o' b v o' b 2 , ... 
possédant les deux propriétés suivantes : 

— les droites correspondantes dans la transfor¬ 
mation projective se coupent à angle droit (oa 1 _L| o' b v 
oa 2 ±| o' b 2 ,...) ; 

— la droite oo' a pour correspondante dans la 
transformation en cause une droite o' cd' non confon¬ 
due avec oo', et inversement o' o a pour correspon¬ 
dante une droite ow non confondue avec o' o. 

Si l’on joint par un trait continu les points d’intersec¬ 
tion des droites correspondantes, on obtient une 




Le théorème de Pappus et son théorème corrélatif : 
on passe du cas I au cas II en remplaçant la notion de 
points alignés par celle de droites concourantes. 


courbe fermée appelée cercle (figure ci-dessous), 
dont les propriétés sont rappelées p. 143 (en particu¬ 
lier : le cercle est le lieu des points d’où l’on voit le 
diamètre oo' sous un angle droit). Cette courbe peut 
être aussi obtenue en coupant un cône de révolution 
par un plan convenablement incliné (en l’occurrence 
perpendiculaire à l’axe). On l’appelle, pour cette 
raison, une section conique. Si l’on n’avait pas astreint 
les droites correspondantes des deux faisceaux à se 
couper à angle droit, on aurait obtenu des courbes 


Une définition du cercle. 

C’est l’ensemble des intersections à angle droit 
des droites du faisceau de centre o (faisceau bleu) et 
des droites du faisceau de centre o 1 (faisceau noir). 
La droite oo' qui joint les deux centres des faisceaux 
est le diamètre du cercle ; le milieu du segment oo ' 
est le centre du cercle. 



d’allures différentes, qui sont aussi des sections coni¬ 
ques et appelées, par les géomètres grecs : ellipses, 
paraboles, hyperboles (voir p. 148). 

• Surfaces réglées. On appelle ainsi des surfa¬ 
ces sur lesquelles on peut tracer des droites. Le 
cylindre et le cône sont des exemples simples de 
surfaces réglées, les droites en question étant les 
génératrices du cylindre (génératrices parallèles) ou 
du cône (génératrices concourantes au sommet). Nous 
verrons p. 94 qu’on peut représenter une surface par 
une équation ; lorsque cette équation est du second 
degré, la surface est appelée une quadrique. On 
démontre, en géométrie euclidienne, que la quadrique 
réglée est un hyperboloïde de révolution à une nappe, 
un paraboloïde hyperbolique, un cône ou un cylindre 
elliptique. 

• Rapport anharmonique, ou birapport. Soient 
quatre points a, m, b, n, sur un axe, pris dans cet ordre 
{m entre a et b, n extérieur à a et b, à droite de b) ; on 
appelle rapport anharmonique (ou birapport) de ces 
quatre points le quotient : 

ma na . , . 

= : = = (ambn ) . 
mb nb 

Le lecteur remarquera que {ambn) est différent de 
( abmn ) par exemple, puisque, d’après la définition : 

(abmn ) = = : {ambn ). 

bm nm 

Si {ambn) = - 1, le birapport est dit harmonique ; on 
a alors : 


. . . ma na . . ma na 

{ambn ) = = : — = - 1 => = = — =. 

mb nb mb nb 

Un faisceau de droites, de centre o, passant par les 

points a,m,b,n a pour rapport harmonique {ambn) ; s’il 
coupe une autre droite en a', m', b’, n', on aura 
(a' m' b' n’) x {ambn). D’une manière générale, une 
transformation projective conserve le rapport anhar¬ 
monique (d’une division ou d’un faisceau). Le rapport 
anharmonique est un invariant projectif {U est conservé 
pour toute transformation projective). 


Conclusion. 

Les propriétés projectives des figures nous condui¬ 
sent donc à traiter l’espace, c’est-à-dire l’ensemble des 
points, d’une manière particulière grâce à ce groupe de 
transformations appelé le groupe projectif. Mais cela 
n’est possible qu’à la condition de tenir compte des 
points à l’infini et du plan à l’infini qui les contient, et 
ce considérer ce plan comme un plan ordinaire. Un tel 
ensemble de points, dans lequel on peut faire des 
opérations plus générales que dans l’espace 
« ordinaire » (euclidien), est appelé espace projectif. 
La systématisation des géométries, due au mathémati¬ 
cien allemand Félix Klein {Programme d’Erlangen, 
1872), se présente donc, dans ses grandes lignes, 
ainsi : 

1 - La géométrie projective étudie les propriétés 
des figures qui restent invariantes dans une transfor¬ 
mation du groupe projectif. 

2-11 existe un sous-groupe du groupe projectif 
qui laisse invariants une droite en géométrie plane, un 
plan en géométrie dans l’espace, un espace à n-1 
dimensions dans la géométrie à n dimensions : les 
propriétés invariantes pogr les transformations de ce 
sous-groupe sont des propriétés affines, et la théorie 
qui les étudie est la géométrie affine (dont nous avons 
étudié quelques aspects p. 82). 

En géométrie plane, la droite invariante est appelée 
droite à l’infini de cette géométrie ; en géométrie dans 
l’espace, le plan invariant est le plan à l’infini de cette 
géométrie. 

3 - Si l’on astreint deux points de cette droite à 
l’infini à être invariants dans un sous-groupe de trans¬ 
formations appartenant au groupe affine, on obtient 
des géométries particulières, comme la géométrie 
euclidienne {groupe des similitudes) ou la géométrie 
de la physique relativiste {groupe de Lorentz). 

4 - Le groupe des transformations qui admet¬ 
tent comme invariant une conique est aussi un 
sous-groupe du groupe projectif ; il caractérise des 
géométries non euclidiennes (géométrie elliptique, 
géométrie hyperbolique). 

Puisque la géométrie projective est un système 
cohérent dont les diverses géométries particulières 
peuvent se déduire, il est tentant d’envisager un 
exposé axiomatique de la géométrie, qui, au lieu de 
partir des axiomes utilisés en géométrie élémentaire 
(comme nous l’avons fait précédemment), fasse dériver 
les théorèmes d’axiomes de l’espace projectif. 
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TRIGONOMETRIE 



La trigonométrie (étymologiquement : « mesure des 
triangles ») a été inventée par les astronomes grecs 
pour calculer les éléments d’un triangle (ses angles et 
ses côtés). Elle a conduit à associer à chaque angle des 
grandeurs appelées rapports trigonométriques, ou 
fonctions circulaires (la première expression est utili¬ 
sée surtout dans les problèmes de mesure ; la seconde 
est relative aux arcs et concerne les problèmes géné¬ 
raux et l’analyse). Le fondateur de la trigonométrie 
semble avoir été l’astronome grec Hipparque (II e siècle 
av. J.-C.), qui fut suivi dans cette voie par le mathémati¬ 
cien Ménélaos (= Ménélaüs) d’Alexandrie, créateur de 
la trigonométrie sphérique au I er siècle ap. J.-C. Toute¬ 
fois la première œuvre qui nous soit parvenue sur le 
sujet est celle de Ptolémée, qui consacre une partie de 
VAlmageste aux notions fondamentales de la trigono¬ 
métrie (v. 150 ap. J.-C.). A partir du IX e siècle, les 
mathématiciens et astronomes arabes construisent des 
tables relativement développées des fonctions circulai¬ 
res, à partir des définitions de Ptolémée et des calculs 
des mathématiciens de l’Inde, qui ont introduit le sinus 
et le cosinus ; ils ont eux-mêmes défini la sécante et la 
cosécante. Parmi ces mathématiciens, on peut isoler 
les noms de : al-BâttanT (IX e siècle), à l’origine des 
notions de sinus, de tangente et de cotangente ; Abu ^ 
al-Wafâ (fin du X e siècle) ; al-B7rün7 (973-1048), qui a | 
généralisé les lois de la triangulation ; Jabir de Séville g 
(XI e siècle) ; Nàsir ad-Dïn at-TüsT (XIII e siècle), qui a | 
donné à la trigonométrie plane et à la trigonométrie I 
sphérique leurs formes définitives. ^ 

En Occident, l’initiateur des théories trigonométri- © 
ques fut l’Allemand Johan Müller (= Regiomontanus), o 
au XV e siècle. Mais c’est Viète qui a publié le premier | 
traité moderne de trigonométrie, en 1579, sous le titre 3 
Canon mathematicus ; les tables trigonométriques ^ 
construites par Viète sont en rapport avec la multiplica- ^ 
tion et la division des arcs et le calcul du nombre tt, que '§ 
Viète a exprimé avec 10 décimales exactes (Ludolph en ^ 
calculera 32 une trentaine d’années plus tard). L’inven- f 
tion des logarithmes, au XVII e siècle, a permis le déve- | 
loppement du calcul trigonométrique. Au XVIII e siècle, I 
la notion de mesure des angles s’efface devant celle de ^ 
fonctions circulaires et de fonctions hyperboliques ~Z 
(Euler). 2 


MESURE DES ANGLES. 


Unités. 

Il est commode d’associer la mesure d’un angle, 
c’est-à-dire la partie du plan limité par deux demi-droi¬ 
tes qui ont une origine commune appelée sommet de 
l’angle, dont le sommet coïncide avec le centre d’un 
cercle à celle d’un arc de cercle intercepté par les côtés 
de cet angle. L’angle au centre interceptant un arc égal 
au quart de la circonférence est un angle droit ; l’angle 
au centre interceptant la moitié de la circonférence est 
un angle plat \ l’angle au centre interceptant toute la 
circonférence, c’est-à-dire dont les deux côtés sont 
confondus, est le plan. 

— Le degré est la 90 e partie d’un angle droit. On 
a donc : 

1 Droit = 90°; 1 Plat = 180°; Plan = 360° . 

Le degré est divisé en 60 minutes ('), la minute en 
60 secondes ("). Au-delà, on utilise des divisions déci¬ 
males de la seconde (0,1", 0,01", etc.). La division en 
degrés est commode, en géométrie élémentaire, car le 
cercle se prête facilement à une division sexagésimale 
(en construisant six arcs consécutifs dont la corde est 
égale au rayon, on partage le cercle en six parties 
égales, qui sont six arcs de 60° chacun). Elle n’est pas 
commode, par contre, pour les calculs courants, en 
raison de sa nature sexagésimale, qui impose des 
conversions. 

— Le grade (gr) est la centième partie d’un 
angle droit. C’est une division décimale (ses sous-mul¬ 
tiples sont le décigrade, le centigrade, etc.). Le grade 
est donc une unité commode pour les calculs prati¬ 
ques. On a les équivalences : 

1° = 1,111 ...gr, 1 gr = 54'. (1) 

— Dans les problèmes théoriques, on mesure 
les angles en radians (rad). Étant donné un cercle de 
rayon R, un arc de longueur / a pour mesure x = l/R 
radians. Cette définition nous montre que : 1° un arc de 


Un nombre comme V2 est une quantité irrationnelle ; aussi loin qu’on pousse les calculs, on ne trouvera 
jamais sa valeur rigoureuse. Néanmoins, il est possible d’en donner une représentation géométrique : un carré 
de côté égal à 1 possède une diagonale égale à V2. Le nombre ir, qui désigne le rapport entre la circonférence 
d’un cercle et son diamètre, est lui aussi « incalculable » ; mais il n’existe aucune construction géométrique qui 
permette de le représenter. C’est là une conséquence de la transcendance du nombre tt (un nombre 
transcendant est un nombre qui n’est la solution d’aucune équation algébrique à coefficients entiers ; un nombre 
irrationnel n’est pas transcendant, car il peut être solution d’une telle équation). 

Au Palais de la Découverte, à Paris, les 627 premières décimales de rr ont été inscrites autour d’une coupole 
(elles ne sont d’ailleurs pas toutes exactes). 


1 radian sur un cercle de rayon R a pour longueur 
l = R , 2° un angle au centre de 1 radian intercepte un 
arc de 1 radian. 

Si l’on convient de faire toutes les mesures toujours 
avec la même unité de longueur, et si l’on choisit de 
rapporter les angles à un cercle de rayon R = 1 mètre, 
un arc de cercle de longueur 1 mètre sur ce cercle aura 
donc pour mesure 1 radian. Ainsi la circonférence 
(360°), dont la longueur est 2ttx1=2tt mètres 
(tt = 3,14159...), mesure donc, en radians, 2 tt radians ; 
et l’on a immédiatement : 


180° 

2 TT 
~2~ 

= TT rad ; 

(2) 


2 TT 

TT 

(3) 

CD 

O 

= 

= — rad ; 

2 


180° 

TT 


O 

CD 

3 

= 3 rad; 

(4) 

30° 

180° 

TT 

(5) 

6 

= 6 rad; 

45° 

90° 

TT 


2 

= — rad ; 

4 

(6) 


sommet O la portion de l’espace comprise à l’intérieur 
d’un cône de sommet O (remarquer le parallélisme 
avec la définition de l’angle dans le plan). On mesure 
un angle solide en stéradians (voir figure à la page 
suivante), le stéradian étant défini selon le même 
principe que le radian, en remplaçant le cercle de 
rayon R= 1 par une sphère de rayon R= 1, et la 
longueur / de l’arc de cercle considéré par la surface fl 
(oméga majuscule) découpée sur la sphère par l’angle 

Mesure d’un angle en radians. 


et 

1 rad = 57° 17' 45" = 63,662 gr (7) 

(par approximation, bien entendu, puisque tt ne peut 
être connu exactement). 

— Dans l’espace, on appelle angle solide de 
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Mesure d’un angle solide en stéradians. 


solide (c’est-à-dire par le cône de sommet O). La 
mesure en stéradians de l’angle solide considéré est 
égale à Cl. Par conséquent, la totalité de l’espace 
correspond à CI=4tt stéradians (surface de la 
sphère = 4 ttR 2 = 4 tt) ; l’angle solide correspondant à 
tout l’espace situé d’un même côté du plan est égal à 
2 tt stéradians ; l’angle solide correspondant à un cône 
d’angle au sommet égal à 90° est égal à tt stéradians. 

Généralisation. 

Mesure d'un arc (ou d'un angle) modulo 2 ji. 

Considérons un cercle de rayon R = 1 sur lequel on a 
choisi un sens de parcours (sens inverse de celui des 
aiguilles d’une montre) et une origine A des arcs. 

L’expression « arc AM » désigne tout arc qui a pour 
origine A et pour extrémité M, c’est-à-dire : 

— le plus petit de tous les arcs AM parcourus 
dans le sens positif sur le cercle ; soit a sa valeur en 
radians ; 

— l’arc a + 2 tt qui correspond à l’arc AM 
augmenté d’un tour complet (qui aboutit, par consé¬ 
quent, à M) ; 

— l’arc a+4 tt et, de même, les arcs c*-i-6tt, 
û:+8 tt, etc., soit d’une manière générale a + 2 kir 
( k = nombre positif entier ou zéro) ; 

— le plus petit des arcs AM parcourus dans le 
sens négatif sur le cercle, soit a' = 2 tt - a (puisque le 
cercle complet mesure 2 tt) ; 

— d’une manière générale les arcs a’ + 2 k' tt, 

Un exemple de résolution de triangle : 
comment mesurer la hauteur d’une tour inaccessi¬ 
ble, d’après un manuscrit de 1538 (époque à laquelle 
on savait résoudre des problèmes autrement 
complexes, d’ailleurs). 



fût fi TdiV quA t *h tu pcttff -nui» 
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soit : 

a' = (2tt — a) + 2 k' tt = — et + 2 Iitt (1 ) 

(h = nombre entier positif différent de zéro; pour 
h = 1 , on a a' = — a + 2 tt). 

On dit que l’arc a et l’arc a sont mesurés modulo 2 tt 
(ou « à 2 /ctt près »). Physiquement, cela correspond à 
mesurer l’angle dont tourne une demi-droite (ou l’arc 
que parcourt un mobile sur un cercle) à un nombre 
entier de tours près. 


Angle de deux droites dans le plan orienté. 

Définissons, dans le plan, un sens positif de rotation, 
par exemple le sens inverse des aiguilles d’une montre. 

• Angle de deux droites. Soient D et D' deux 
droites du plan. 

— Si D et D' ne sont pas orientées, on appelle 
angle de ces deux droites l’un quelconque des angles 
dont il faut faire tourner D pour l’appliquersui^D'. Soit 
a l’un de ces angles ; les autres angles (t5\D') sont : 

a + 2 /ctt ; 

a — tt + 2 /(tt = a + (2 k — 1)tt. (2) 

Ces deux déterminations (2 k : nombre pair de fois 
tt ; 2 k — 1 : nombre impair de fois tt) se résument en 
une seule formule : 

{D^D') = a + Ktt (K : entier ou nul). (3) 

— Si les droites sont orientées (D et D'), on 
appelle angle de leurs directionsj’un quelconque des 
angles dont il faut faire tourner Ü pour l’appliquer sur 
0 de sorte que les deux droites confondues aient la 
même orientation. On le note ( 0, 0). Si a désigne un 
de ces angles, tous les angles possibles sont donnés 
par : 

a + 2 krr, — (2 tt — a) + 2 /ctt = a + 2 k' tt (4) 
(voir figure) ; c’est-à-dire que : 

(D, D’) = a+2hTT . (5) 

• Relation de Chasles. 

— Droites orientées : 

(D, D') + (D', D") + (D", D) = 2 kTT (6) 


— Droites non orientées : 

(D^CT) + {D^D^} + (D\^D) = /ctt (7) 

(Remarquer le parallélisme avec la relation de Chasles 
pour des segments : ah + bc + ca = 0 : le côté 
«extrémité» d’un angle est le côté «origine» du 
suivant). 

— Si l’on a choisi un axe de référence, Ox, 
orient^ de O vers x, et que l’on ait : 
(Ôx, D) = 6+2 krT,(Ôx, D') = 6' + 2 kTT (angles polai¬ 
res de D et de D'), on aura : 

(D, D') = 6' - 6 + 2 /ctt . (8) 

Ici aussi, comparer avec la relation de Chasles : 

ab = ob-oa : (9) 


LES FONCTIONS CIRCULAIRES. 
Définitions. 

Considérons un cercle de centre O, de rayon R = 1, 
muni de deux axes rectangulaires OX et OY, et d’un 
sens de parcours (sens inverse de celui des aiguilles 
d’une montre). Menons en outre les tangentes à ce 
cercle en A et en B, orientées comme cela est indiqué 
sur la figure ci-dessous. A tout point M du cercle 
correspond un arc AM = x. Comme nous venons de le 
dire, cet arc est mesuré modulo 2 tt. 



Fonctions circulaires. 


Par définition, on appelle fonctions circulaires de 
l’arc x les nombres réels qui co nstit uent les mesures 
algébriques des segments OP, OQ, AT et BV. Ces 
nombres sont appelés respectivement le cosinus, le 
sinus, la tangente et la cotangente de l’arc x. On écrit : 

OP = cos x, OQ = sinx, 

A7=tanx, BV = cot x, ^ 


Angle de deux droites. 

I - Droites non orientées. 
Il - Droites orientées. 



(lire: « cosinus x », «sinus x », «tangente x », 
« cotangente x » ; les notations « tg x » et « cotg x » à 
la place de « tan x» et « cot x» sont encore largement 
employées, mais non recommandées). 

On définit aussi les deux fonctions sécante et cosé¬ 
cante par les relations : 


séc x 


1 

COS X ’ 


1 

cosec x = —-. 

sin x 


( 2 ) 


Quelques propriétés fondamentales 
des fonctions circulaires d'un arc. 

Périodicité. 


On 



Cette notion sera reprise p. 112. Il est facile, dès 
maintenant, de se rendre compte que les arcs x et 
(x + 2 jt) ou (x + 2 /or), se terminant en un même point 
M, ont même sinus et même cosinus. On exprime cela 
en disant que les fonctions numériques sinus et 
cosinus sont périodiques de période 2 jt, et l’on écrit : 

f sin (2 kTT + x) = sin x ; ^, 

[ cos (2 kTT + x) = cos x . ' ' 

Le lecteur constatera de même que les fonctions 
tangente et cotangente sont périodiques de période tt, 
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FONCTIONS CIRCULAIRES 


c’est-à-dire qu’on peut écrire : 

f tan ( /ctt + x ) = tan x ; 

1 cot (/ctt + x ) = cot x . 

Il résulte de cela que, si l’on connaît les valeurs des 
fonctions circulaires des arcs entre 0 et 2 tt, on connaît 
les fonctions circulaires de toute valeur de x plus petite 
que 0 ou supérieure à 2 tt. 


Relations fondamentales. 


Les nombres sin x et cos x sont les coordonnées du 
point M dans le repère cartésien OXY (coordonnées 
rectangulaires). En appliquant le théorème de Pytha- 
gore au triangle rectangle OPM, et en remarquant que : 



PM = OQ = sin x, 

(3) 

on peut écrire : 


PM 2 + OP 2 = R 2 = 1 , 

(4) 

soit : _ 


sim x + cos^ x = 1 . 

(5) 


D’autre part, la similitude des triangles rectangles OAT 
et OPM permet d’écrire : 


AT _ PM sin x 
OA OP cos x 


( 6 ) 


et comme OA = 1 

_ sin x 

AT = tan x =-. 

cos x 


(7) 


De même on aurait : 


cot x = 


cos x 
sin x 


1 

tan x ' 


( 8 ) 


Ces relations entre les fonctions circulaires sont 
fondamentales ; elles permettent d’exprimer l’une 
d’entre elles en fonction des autres (voir p. 148). 

Notons aussi que les fonctions circulaires d’une 
variable x peuvent s’exprimer comme des exponentiel¬ 
les imaginaires (formules d’Euler), à l’aide de la rela¬ 
tion : 


d’où l’on tire : 


e ix = cos x + i sin x , 


cos x 
sin x 


e ,x -f e IX _ 
2 ’ 
e ix - e ix 

2 


(9) 


( 10 ) 


Calcul des fonctions circulaires. 

Dans certains cas simples, les fonctions circulaires 
d’un arc peuvent être calculées à partir des règles de la 
géométrie métrique. On remarquera en particulier que 
les valeurs extrêmes, minimale et maximale, d’un sinus 
ou d’un cosinus sont — 1 et + 1, puisque les positions 
extrêmes des points P et Q sur les axes OX et OY sont 
A et A' pour P, B et B' pour Q. Par contre, tan x et 
cot x peuvent prendre toutes les valeurs de - xà + x 
quand x varie de 0 à 2 tt, puisque les points T et V 
peuvent se déplacer indéfiniment sur l’axe des tangen¬ 
tes et sur l’axe des cotangentes. 

La détermination des valeurs des fonctions circulai¬ 
res pour un arc quelconque compris entre 0 et 2 tt est 
un problème difficile, sur lequel nous ne nous attarde¬ 
rons pas ici. Le calcul a été fait une fois pour toutes et 
l’on a établi des tables des fonctions circulaires ou 
tables trigonométriques. 


B 



Relations trigonométriques dans le triangle 
rectangle. 


Lignes trigonométriques d'un angle. 


Si l’on remplace la considération de l’arc AM par 

l’angle au centre AOM, les fonctions circulaires sont 
appelées souvent lignes trigonométriques de l’angle 


AOM = x. En géométrie appliquée, on est conduit à 
mesurer les éléments d’un triangle, c’est-à-dire ses 
angles et ses côtés (problème de la résolution des 
triangles). En considérant un triangle rectangle ABC, 
rectangle en A, semblable au triangle POM de la figure 
qui nous a servi à définir les fonctions circulaires, on 
démontre aisément les relations suivantes : 


sin C = 
cos C = 
tan C = 
cot C = 


AB 


BC 
AC 
BC 
sin C 


= cos B 


= sin B ; 
_ ÂB_ 


cos C 
AC _ 
AB 


tan 


AC 
B . 


cot B ; 


( 11 ) 


quelconque D du plan. Si l’on projette sur Ox le 
vecteur AB de mesure algébrique AB appartenant à D, 
on a : 


A' B' = proj. AB = AB cos (Ox, D). (13) 

Le cosinus de l’angle (Ox, D) est le rapport de 
projection de D sur Ox : un vecteur l/de D, de grandeur 
géométrique unité, se projette selon un vecteur u' de 
Ox, de grandeur : 

Il u || = | cos {Ox, 3 ) 1 . (14) 


Nous avons déjà utilisé le rapport de projection 
d’une droite sur une autre à propos de la définition du 
produit scalaire, p. 86. 


CALCUL TRIGONOMÉTRIQUE. 


On tire de ces formules la relation suivante fréquem¬ 
ment utilisée : 

AB = BC cos B = BC sin C . (12) 

Projection orthogonale. 

Soient une droite orientée Ox et une droite orientée 


Le lecteur trouvera p. 148 les renseignements 
fondamentaux concernant : 

— les formules de la trigonométrie, 

— la résolution des triangles, 

— les équations trigonométriques, 

— l’inversion des fonctions circulaires. 


GEOMETRIE DESCRIPTIVE ET GEOMETRIE COTEE 


La représentation projective des figures dans 
l’espace a été étudiée par Monge à la fin du 
XVIII e siècle. 

GÉNÉRALITÉS. 

Objet de la géométrie descriptive. 

La géométrie descriptive a pour objet : 

1° - de représenter les figures dans l’espace au 
moyen de figures planes ; 

2° - de résoudre certains problèmes de la géo¬ 
métrie dans l’espace par des constructions effectuées 
sur des figures planes. 

On utilise pour cela des projections sur deux plans 
rectangulaires arbitraires appelés plans de projection ; 
pour les distinguer, on appelle l’un d’eux plan horizon¬ 
tal (plan H), et l’autre plan vertical (plan V). Leur 
intersection xy est appelée la ligne de terre. 

Étant donné un point A dans l’espace, on mène de ce 
point les perpendiculaires aux plans H et V, ce qui 
fournit les projections de A sur ces deux plans, 
respectivement notées a et a v En faisant tourner le 
plan V autour de xy comme charnière, il vient s’appli¬ 
quer sur H et le point a 1 vient en a'. Au cours de ce 
rabattement, la droite a 1 a (voir figure ci-contre) reste 
perpendiculaire à xy. Finalement, à chaque point A de 
l’espace on fait correspondre le couple de points 
(a, a ) qu’on appelle, par abus toléré de langage, les 
projections horizontale et verticale de A. La droite aa', 
perpendiculaire à la ligne de terre, est appelée ligne de 
rappel. La représentation du couple (a, a') dans le plan 
horizontal s’appelle l’épure du point A. 

Une figure (plane ou à trois dimensions) dans 
l’espace étant composée de points, la représentation 


de cette figure en géométrie descriptive est obtenue en 
projetant tous ses points sur les*deux plans H et V. On 
obtient ainsi l’épure de la figure considérée. S’il s’agit 
d’une figure usuelle (droite, polygone, courbe particu¬ 
lière, etc.), il n’est généralement pas nécessaire d’en 
projeter tous les points, mais seulement quelques 
points caractéristiques. 


Quelques définitions. 

• Les deux plans partagent l’espace en quatre 
régions : les dièdres I, II, III, IV, qui ont été indiqués sur 
la figure ci-contre. Il faut noter que le fait que les 
deux plans soient appelés « horizontal » et « vertical » 
n’a pas de signification physique, à moins qu’on ne le 
signifie expressément. 

• La position d’un point dans l’espace est défi¬ 
nie à une translation près si l’on se donne : 1° le dièdre 
dans lequel il se trouve ; 2° sa distance au plan vertical 
(appelée éloignement) et sa distance au plan horizon¬ 
tal (appelée cote). Pour préciser algébriquement le 
dièdre dans lequel se trouve le point A, on choisit dans 
H et V une direction perpendiculaire à xy orientée 
arbitrairement et qui définit le sens positif des éloigne¬ 
ments et le sens positif des cotes. On adopte usuelle¬ 
ment les conventions de la figure ci-contre. 

Généralement on suppose que les objets à représen¬ 
ter sont placés dans le premier dièdre (cote et éloigne¬ 
ment positifs) s’il s’agit de dessins d’architecture ; s’il 
s’agit de dessin industriel, on les place dans le troi¬ 
sième dièdre (cote et éloignement négatifs) ; en per¬ 
spective, on les suppose placés dans le second dièdre. 
Le quatrième dièdre est peu utilisé. 

Nous n’avons pas représenté sur la figure 
ci-contre les plans bissecteurs des dièdres, qui sont 


deux plans perpendiculaires passant par la charnière 
xy. Celui qui est dans le premier et le troisième dièdre 
s’appelle le premier bissecteur ; tout point de ce plan a 

Épure du point A. 
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GEOMETRIE DESCRIPTIVE 


projections du point A. Ainsi ( d) et (8) se coupent en a, 
( d') et (S') se coupent en a'. 



une cote égale à son éloignement (les points a et a' de 
l’épure sont symétriques par rapport à la ligne de 
terre). Un point situé dans le second bissecteur a ses 
deux projections confondues dans le plan horizontal. 

• La géométrie cotée est une forme simplifiée 
de la géométrie descriptive. Elle représente un point A 
par sa projection horizontale a et un nombre (positif ou 
négatif) indiquant sa cote. Dans le cas de la figure 
précédente, par exemple, le point A aurait pour épure 
(a, A ), A désignant la cote du point A (c’est-à-dire la 
mesure algébrique du segment 


REPRÉSENTATIONS FONDAMENTALES. 

Épure d'un point. 

Nous l’avons définie plus haut (p. 91). Quelques 
précisions complémentaires peuvent être retenues (le 
lecteur a intérêt à faire lui-même les figures correspon¬ 
dantes en s’inspirant de la figure que nous avons 
donnée p. 91). 

— Un point M situé sur la ligne de terre a ses 
projections (m, m') confondues avec lui-même sur xy. 

— Un point M situé dans le plan horizontal a sa 
projection verticale m' sur la ligne de terre. 

— Un point M situé dans le plan vertical a sa 
projection horizontale m sur la ligne de terre. 

— Nous avons déjà précisé la position des 
projections d’un point appartenant au premier ou au 
second bissecteur. 

Épure d'une droite. 

La projection orthogonale d’une droite (D) étant une 
ligne droite, à toute droite (D) de l’espace correspon¬ 
dent donc deux droites ( d , d’) dans les plans de 
projection. On obtient ces deux droites en projetant 
deux points quelconques A et B de (D) en (a, a') et 
{b, b'). L’épure de (D) est composée des deux droites 
ab et a' b'. 

On peut retenir les définitions suivantes : 

— on appelle droite de front (ou frontale) une 
droite parallèle au plan vertical de projection ; sa 
projection horizontale est parallèle à la ligne de terre ; 

— on appelle droite verticale une droite perpen¬ 
diculaire au plan horizontal ; sa projection horizontale 
se réduit à un point et sa projection verticale est 
perpendiculaire à la ligne de terre ; 

— on appelle droite de bout une droite perpen¬ 
diculaire au plan vertical ; sa projection verticale se 
réduit à un point, sa projection horizontale est perpen¬ 
diculaire à la ligne de terre ; 

— on appelle droite de profil une droite située 
dans un plan perpendiculaire à la ligne de terre 
(appelée lui-même plan de profil). 


Épure d’une droite. 

La droite (D) (de l’espace) 
coupe les plans de projection 
en h sur le plan horizontal, et 
v , sur le plan vertical, v, se 
rabattant en v’. 

Sur l’épure, les couples 
(h, h’) et (v, v') sont appelés 
les traces horizontale et verti¬ 
cale de la droite D sur les 
plans de projection. Ces deux 
points permettent de tracer 
les projections (d) et (d 1 ) de la 
droite (D). Par ailleurs, deux 
points A et B de (D) se projet¬ 
tent respectivement en a et b 
sur le plan horizontal, a, et b, 
sur le plan vertical, ces deux 
derniers se rabattant en a et 
b'. 

Les couples (a, a') et (b, b’) 
déterminent aussi les projec¬ 
tions (d) et (d') de la droite (D). 


Épure d'un plan. 

Un plan ne peut être représenté par ses projections, 
car elles recouvrent, évidemment, tout le plan H et tout 
le plan V. On le représente donc, en général, par ses 
traces, c’est-à-dire par ses intersections avec les plans 
de projection (voir figure ci-dessous). 

On définit, de la même façon que pour les droites, 
des plans horizontaux, verticaux, de front, de bout et 
de profil. Une propriété importante de la représentation 
du plan en géométrie descriptive est la suivante : si 
deux droites (D) et (/I) d’un plan se coupent en un point 
A, leurs projections de même nom se coupent selon les 


Traces d’un plan. 

Le plan Tl coupe le plan horizontal de projection 
selon la droite otQ et le plan vertical selon la droite 
aP , ; ces deux droites sont les traces horizontale et 
verticale du plan. En projection, «O se projette hori¬ 
zontalement selon elle-même, et verticalement selon 
la ligne de terre ; de même la projection horizontale 
de aP : est la ligne de terre ; on rabat aP, selon la 
méthode habituelle et l’on a sa « projection 
verticale » — au sens de la géométrie descriptive — 
aP'. Le plan 11 est représenté au total par les droites 
(aQ, xy) et (xy, aP') ; on dit communément : « le plan 
QaP' ». 



Surfaces, ombres. 

Surfaces. 

Les méthodes de la géométrie descriptive s’appli¬ 
quent aussi, bien entendu, à la représentation des 
surfaces et des volumes. D’un intérêt primordial sont 
notamment les surfaces qui peuvent être « étalées » 
sur un plan par un procédé quelconque, sans déforma¬ 
tion ni déchirement et qui sont appelées des surfaces 
développables (ainsi on peut dérouler un cylindre ou 
un cône, qui sont des surfaces développables ; par 
contre la surface d’une sphère ne peut être étalée sans 
déchirure, ce n’est pas une surface développable). 

Ombres des surfaces. 

Soit une surface S éclairée par un point lumineux O 
à distance finie. Nous prendrons comme exemple le 
cas d’une surface sphérique. 

L’ombre propre de cette surface est limitée par la 
courbe de contact C du cône de sommet O circonscrit 
à la surface et nommé cône d’ombre ; cette courbe est 
aussi appelée la séparatrice. Le cône d’ombre coupe 
les plans H et V selon deux courbes (c) et (c,) qui sont 
les ombres portées de la surface S sur H et V. Si la 
source lumineuse est à l’infini (ombre dite « au 
soleil »), les rayons lumineux peuvent être considérés 
comme parallèles et le cône d’ombre devient un cylin¬ 
dre d’ombre. 

Dans la pratique, on convient souvent que l’ombre 
est « au soleil » et que les projections des rayons 
lumineux sur H eXV font des angles à 45° avec la ligne 
de terre. 

Contours apparents d'une surface. 

On appelle contour apparent horizontal dans 
l’espace d’une surface la courbe de contact du cylin¬ 
dre circonscrit à la surface parallèlement aux vertica¬ 
les. Le contour apparent vertical dans l’espace se 
définit de la même manière avec un cylindre circonscrit 
à la surface parallèlement aux lignes de bout. Les 
projections sur le plan horizontal et le plan vertical de 
ces contours apparents forment ce qu’on appelle le 
contour apparent horizontal et le contour apparent 
vertical de la surface considérée. On démontre deux 
théorèmes importants pour les représentations des¬ 
criptives : 

— si une courbe tracée sur une surface rencon¬ 
tre le contour apparent horizontal dans l’espace, la 
projection horizontale de cette courbe est tangente au 
contour apparent horizontal de la surface ; 

— si deux surfaces sont tangentes en tous les 
points d’une courbe C, leurs contours apparents hori¬ 
zontaux et la projection horizontale de la courbe C 
sont eux-mêmes tangents en un même point. 


Ombres d’une sphère. 
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GEOMETRIE ANALYTIQUE 



René Descartes (1596-1650) : inventeur de la géométrie analytique, il a mis les mathématiques sur une voie 
nouvelle, réalisant, pour la première fois, le parallélisme entre le langage géométrique presque expérimental et 

le langage algébrique. 


Les inconvénients des méthodes de la géométrie 
classique ont conduit les mathématiciens à étendre au 
domaine géométrique les avantages des automatismes 
de l’algèbre. C’est à Descartes que l’on doit, pour 
l’essentiel, l’invention de la géométrie analytique. Le 
présent exposé n’étudie que la partie de la géométrie 
analytique qui ne fait pas appel à l’analyse ; il doit être 
complété par les pages 123-124 où l’on dit quelques 
mots de la géométrie différentielle et par les pages 
155-158. Les résultats techniques particuliers sont 
donnés p. 151. 


APERÇU HISTORIQUE. 

L'invention de la géométrie analytique. 

Descartes. 

Au XVII e siècle, les mathématiciens disposent d’un 
outil nouveau, forgé par leurs prédécesseurs de la 
Renaissance : l’algèbre symbolique, qui permet de 
calculer élégamment et rapidement sur des quantités 


indéterminées et de résoudre les équations à l’aide de 
formules, d’une manière quasi automatique. 

Fermât et Descartes ont été les premiers à « mettre 
en équations » des problèmes géométriques. Descar¬ 
tes se préoccupe particulièrement des sections 
coniques (ellipse, parabole, hyperbole) et du fameux 
« problème de Pappus » qui conduit à des équations 
de degré supérieur à 2. Ces travaux l’amènent à 
introduire la notion de système de coordonnées pla¬ 
nes, chaque point du plan étant défini par son abscisse 
x et son ordonnée y, obtenues en projetant sur des 
axes Ox et Oy, rectangulaires ou obliques (voir ci- 
après p. 95). Une courbe algébrique est alors définie 
par la relation f(x, y) = 0 qui existe entre les 
coordonnées de chacun de ces points. Par exemple, 
tous les points M(x, y) d’une droite vérifient l’équation 
Ax + By -F C = 0, les coefficients A, B et C dépendant 
de la position de la droite dans le plan ; etc. (voir 
p. 149). Descartes a exposé sa méthode dans un 
ouvrage intitulé La Géométrie, deuxième partie des 
Essais, publiés en 1637 (la préface à ces Essais, qui 
traitaient aussi d’optique et de météorologie, est un 
des textes les plus célèbres de la philosophie : c’est le 
fameux Discours de la méthode). 

Il faut noter que, dès sa naissance, la géométrie 


analytique a connu ses premières difficultés. Descartes 
s’était contenté de donner une méthode pour repré¬ 
senter une courbe par une équation et chercher des 
lieux géométriques par le calcul. Sa géométrie se 
limitait aux courbes que l’on peut construire à l’aide de 
la règle et du compas et il n’avait pas résolu le 
problème fondamental de la détermination de la tan¬ 
gente à une courbe en un point. Certes, il possédait — 
comme tous les mathématiciens — les recettes de la 
géométrie classique : la tangente au cercle en un point 
est la perpendiculaire au rayon en ce point, la tangente 
à l’ellipse en un point est la bissectrice des rayons 
vecteurs de ce point, etc., mais ce n’était pas là une 
méthode générale. Ainsi donc, dès sa naissance, la 
géométrie analytique exigeait d’être développée. 

Fermât et Roberval. 

Le problème des tangentes fut particulièrement étu¬ 
dié par Fermât, entre 1630 et 1660, et ce dernier fut très 
près d’en découvrir la solution générale, qui relève, 
comme nous le verrons, de Vanalyse (en particulier, la 
solution de ce problème utilise la propriété démontrée 
par Pascal relative au rapport des côtés d’un triangle 
rectangle). 

Un autre problème, de caractère métrique, restait en 
suspens : comment calculer l’aire limitée par une 
courbe ou par une portion de courbe ? Là aussi, la 
géométrie classique avait autant de formules que de 
courbes, et ne proposait aucune méthode générale de 
calcul. La géométrie analytique balbutiante de Descar¬ 
tes est, sur ce point, aussi mal embarquée. Toutefois, 
en 1645, Roberval propose une méthode de 
« quadrature » des courbes algébriques, utilisant le fait 
que ces courbes sont toutes représentables par des 
équations, et qui consiste à utiliser des courbes auxi¬ 
liaires appelées quadratrices (voir figure ci-après). 
Cette méthode suppose qu’il y a un certain lien (mais 
lequel ?) entre le problème des tangentes et le pro¬ 
blème des aires : ce lien sera découvert par Leibniz et 
par Newton, inventeurs du calcul différentiel et inté¬ 
gral. 





Quadratrice de Roberval. 

Soit C une courbe d’équation f(x, y) = 0 , et soit à 
calculer l’aire colorée en orange AMm. Menons la 
tangente en M, qui coupe l’axe des x en T, et 
construisons le point N, d’abscisse x = OT et d’ordon¬ 
née y = mM. A chaque point M correspond un point N, 
et le lieu des points N est une courbe r, d’équation 
g(x, y) = 0, appelée quadratrice (parce qu’elle sert à 
<< carrer » la courbe C, c’est-à-dire à évaluer son 
aire). L’aire MAN est équivalente à l’aire AMm. 


La géométrie analytique classique. 

Au XVIII e siècle, la géométrie analytique va largement 
dépasser les buts que lui avait assignés Descartes qui 
n’y voyait, à l’origine, qu’une application de l’algèbre à 
la géométrie facilitant la résolution de certains problè¬ 
mes. Ainsi va se définir la géométrie analytique clas¬ 
sique. 

La théorie des courbes planes. 

Descartes n’avait étudié d’une manière approfondie 
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que les courbes planes du second degré, c’est-à-dire 
les coniques. Newton et ses successeurs immédiats 
ont étudié d’une manière systématique les courbes du 
troisième degré, ou cubiques, et les courbes de degrés 
supérieurs. Newton montra la voie à suivre en décrivant 
72 cubiqueé et en démontrant qu’on pouvait toutes les 
obtenir à partir de cinq cubiques fondamentales. On lui 
doit aussi d’avoir employé systématiquement les coor¬ 
données négatives (dont Descartes se méfiait). 

Parmi les mathématiciens qui s’attachèrent à l’exa¬ 
men analytique des courbes algébriques, on citera : 
Stirling, McLaurin, Goudin, Waring, Riccati, Saladini, 
etc., dont nous retrouverons les noms en analyse. La 
théorie des courbes planes, qui comprend l’étude de 
leurs formes, de leurs branches infinies, de leurs 
tangentes, de leurs asymptotes, de leurs points remar¬ 
quables, etc., a été systématisée au XVIII e siècle par 
Cramer (1750) et par Euler ( Introduction à l’analyse des 
infiniment petits, 1748). 

Nous verrons que c’est l’approfondissement des 
propriétés des courbes qui engendrera un nouvel essor 
de la géométrie analytique au XIX e siècle. 


La théorie des surfaces. 

La deuxième conquête de la géométrie analytique fut 
celle de la troisième dimension. Les courbes étudiées 
par Descartes, Newton, Cramer, Euler et les autres sont 
des courbes planes, et leurs aires sont des surfaces 
planes. La Hire introduit en 1679 la considération d’un 
système de coordonnées spatiales (x, y, z), ce qui 
revient à construire un troisième axe de coordonnées 
Oz, perpendiculaire aux axes Ox et Oy définissant le 
plan. Un point dans l’espace est alors déterminé par 
trois nombres réels (x, y, z), et l’équation f(x, y, z) = 0 
définit une surface gauche. Les problèmes qui se 
posent sont alors les suivants : 

1 - déterminer l’équation des surfaces usuelles 
(sphère, cône, hyperboloïde de révolution, etc.) ; 

2 - étudier leurs plans tangents ; 

3 - déterminer systématiquement la nature des 
surfaces définies par des équations du deuxième, 


troisième, ..., du n-ième degré. Ce dernier problème 
concerne la courbure, les plans tangents, l’allure géné¬ 
rale, etc. de ces surfaces. 

Ces recherches furent commencées par A. Parent, 
puis, d’une façon plus systématique, par A. Clairaut 
(Recherches sur les courbes à double courbure, 1731 ). 
Euler étudia, pour sa part, les surfaces du deuxième 
ordre, qu’on nomme des quadriques, définies par une 
équation du deuxième degré. 


Systématisation. 

Les derniers progrès furent accomplis par Lagrange 
(1773) et par Monge (1795-1802). Lagrange a montré 
combien était grande l’importance des éléments linéai¬ 
res (droite et plan) représentés par des équations du 
premier degré, et il a perfectionné le symbolisme. 

Monge a repris ce point de vue, en étudiant les 
changements de systèmes de coordonnées par des 
transformations linéaires, et les familles de droites et 
de plans (étudiées à l’aide d’équations paramétriques). 


XIX e et XX e siècles. 

La géométrie plückerienne. 

Au XIX e siècle, la géométrie analytique bénéficie du 
progrès de l’analyse, de la théorie des groupes et du 
développement de la géométrie projective. Elle subit 
alors des transformations profondes qui contribuent à 
l’algébriser davantage et qui débouchent sur la géomé¬ 
trie algébrique moderne. 

Les mathématiciens allemands élargissent le 
concept de coordonnée et créent une nouvelle 
méthode de calcul. L’un des problèmes les plus embar¬ 
rassants pour les géomètres de cette époque était en 
effet la lourdeur des calculs analytiques, et en particu¬ 
lier les difficultés provenant des techniques d’élimina¬ 
tion. C’est J. Plücker qui trouva une solution élégante à 
ce problème, à partir de 1828, en introduisant la notion 
de coordonnées homogènes (voir p. 150). Le même 
géomètre systématisa l’étude des courbes algébri¬ 
ques : étude des points doubles, des points de 


rebroussement, des points d’inflexion, des éléments 
imaginaires et des éléments à l’infini. 

La méthode de Plücker fut généralisée par les algé- 
bristes du XIX e siècle qui utilisèrent les ressources de 
l’algèbre linéaire : O. Hesse (1861-1865) et Cayley en 
particulier. Parallèlement aux travaux de Plücker, 
Môbius introduit les coordonnées barycentriques 
(1827). 


Théorie des courbes et des surfaces. 

Avec ces méthodes, la théorie des courbes et des 
surfaces fit de nouveaux progrès : les surfaces du 
deuxième ordre (quadriques) sont étudiées par Cau¬ 
chy, Magnus, Plücker et Hesse ; les surfaces du troi¬ 
sième ordre par Cayley, Salmon, Clebsch, Cremona, 
Jordan, Félix Klein, Brioschi, Sturm, etc. ; les surfaces 
du quatrième ordre par Steiner, Dupin, Kummer, Wed- 
dle ; ec. 

En 1865, Plücker introduit une nouvelle méthode 
pour caractériser une droite (à l’aide de six coordon¬ 
nées homogènes, composantes d’un vecteur porté 
par la droite et du moment de ce vecteur par rapport à 
l’origine). Cette innovation permet le développement 
élégant de la géométrie réglée (une surface réglée est 
une surface sur laquelle on peut toujours appliquer 
une droite : par exemple une surface cylindrique peut 
être considérée comme engendrée par une droite 
s’appuyant sur un cercle). 

Le XIX e siècle est aussi le siècle de l’apparition des 
géométries à n dimensions. Cayley introduit, en 1843, 
le concept de variété à n dimensions et Riemann 
reprend, en le généralisant, ce concept dans un 
mémoire célèbre ( Sur les hypothèses qui servent de 
fondements à la géométrie, 1854). La géométrie analy¬ 
tique à n dimensions a été exploitée par Klein, 
Helmholz, Lipschitz, etc. 


Au XX e siècle. 

Au XX e siècle, la géométrie analytique se confond, 
dans ses lignes essentielles, avec la géométrie diffé¬ 
rentielle, la géométrie infinitésimale et la géométrie 
algébrique. 




Repère cartésien dans le plan. 

I - Repère affine : i et j sont quelconques ; les unités sur les axes sont différentes. 

II - Repère orthonormé (euclidien) : le parallélogramme de la figure I est devenu un rectangle 

et l’on peut appliquer le théorème de Pythagore : OM 2 = x 2 + y 2 . 

III - Repère orthonormé (euclidien) : le plan est divisé en quatre quadrants ; on a indiqué leur 

numérotation traditionnelle et les bissectrices des axes. 


Repère cartésien dans l’espace. 

I - Repère affine. 

Il - Repère orthonormé. 

III - Repère orthonormé (mise en évidence des bissecteurs). 
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COORDONNÉES D'UN POINT. 

Nous avons, à plusieurs reprises, insisté sur le 
repérage d’un point sur une droite, dans le plan ou 
dans l’espace, ce qui nous a conduit à associer à 
chaque point un, deux ou trois nombres réels, appelés 
les composantes {ou coordonnées) du vecteur corres¬ 
pondant à ce point. 

L’essence de la géométrie analytique consiste à 
opérer sur ces nombres , alors que la géométrie 
«ordinaire» étudie les figures auxquelles ces points 
appartiennent. Il est bien évident que les coordonnées 
d’un point peuvent être déterminées par n’importe 
quelle convention en accord avec les lois de la géomé¬ 
trie dans laquelle on se place et qu’elles seront tou¬ 
jours au nombre de deux si l’on fait de la géométrie 
euclidienne plane, au nombre de trois si l’on fait de la 
géométrie euclidienne dans l’espace, le choix des 
conventions dépendant de la nature du problème posé. 
Un géographe qui veut repérer un point à la surface de 
la Terre utilise deux coordonnées, qui sont la latitude 
et la longitude du lieu ; un enfant qui joue à la « bataille 
navale » caractérise la position d’une case par l’indica¬ 
tion, dans cet ordre, de la ligne et de la colonne 
auxquelles elle appartient, etc. En géométrie analyti¬ 
que on a été ainsi amené à définir divers systèmes de 
coordonnées , utilisés selon les propriétés que l’on veut 
mettre en évidence. 


Repère cartésien. 

Repère cartésien dans le plan. 

Nous le connaissons déjà (voir figures de la page 
ci-contre) : il est constitué par deux droites distinctes 
qui se coupent en un point O, dont chacune est dotée 
d’un vecteur unitaire indiquant à la fois le sens positif 
choisi sur la droite (qui est donc un axe) et Vunité de 
longueur sur cet axe. On a coutume de désigner les 
deux axes de la manière suivante : 

— axe Ox, ou axe des abscisses, de vecteur 
unitaire / ; 

— axe Oy, ou axe des ordonnées, de vecteur 
unitaire y ; 

(/et/constituent une base pour tous les vecteurs du 
plan considéré.) 

A un point M quelconque du plan on peut associer le 
vecteur géométrique OM. Il se décompose (voir p. 96) 
en menant par M des parallèles aux axes, ce qui 
donne deux vecteurs, OP et OQ, tels que 


OM = OP + OQ = xi -1- x/, 

(1) 

rx= OP = abscisse de M, 
ty = OQ = ordonnée de M . 

(2) 


Les nombres réels x et y sont les coordonnées 
cartésiennes du point M ; selon la position de ce point 
dans le plan, ils sont positifs ou négatifs (et nuis si M 
est confondu avec l’origine O). Pour désigner un point 
M en géométrie analytique plane, on écrira donc 
M(x, y), comme on l’a fait sur la figure de la page 
ci-contre, en convenant de nommer d’abord l’abscisse, 
ensuite l’ordonnée. 

Ce repère est appelé repère affine, la base (/,/) étant 
quelconque. On l’utilise pour l’étude des propriétés 
affines des figures (voir pp. 99-101), c’est-à-dire 
celles qui ne font pas intervenir les notions d’angle et 
de distance. Lorsqu’on doit étudier des propriétés 
métriques (c’est-à-dire faisant intervenir des angles ou 
des distances), on choisit une base composée de deux 
vecteurs / et/de même grandeur (même norme) et 
orthogonaux. Une telle base est dite orthonormée et le 
repère est dit (par abus de langage) orthonormé, ou 
euclidien. On conviendra en outre, dans tous les cas, 
que le sens positif des rotations dans le plan se fait de 
Ox vers Oy (on dispose les axes de sorte que ce sens 
soit l’inverse de celui des aiguilles d’une montre). 

Repère cartésien dans l'espace. 

Choisissons un point O, origine, et trois vecteurs 
unitaires, /, / et k, linéairement indépendants (voir 
figure à la page ci-contre) ; les axes Ox, Oy et Oz, 
issus de O, parallèles à ces vecteurs et orientés par 
eux, forment un trièdre de référence. Le vecteur OM 
associé à un point M quelconque se décompose en 
trois vecteurs, OP, OQ et OR, qui sont les arêtes d’un 
parallélépipède, et l’on a: 

OM = OP + OQ + OR = xi + yj + zk , (3) 

f x = OP = abscisse du point M , 
avec < y = OQ = ordonnée du point M , (4) 

[ z = OR = cote du point M . 


COORDONNÉES CARTÉSIENNES 


Les nombres réels x, y et z sont les coordonnées 
cartésiennes du point M dans l’espace. On convient le 
plus souvent de regarder le plan xOy comme horizon¬ 
tal, Oz étant au-dessus de ce plan. Le trièdre Ox, Oy, 
Oz est alors un trièdre direct. 

Si /,/et Jrsont quelconques, le repère est affine. Si 
l’on veut étudier les propriétés métriques des figures, 
on choisit i, jet kde sorte qu’ils soient égaux en 
longueur et deux à deux orthogonaux ; le repère est 
alors dit euclidien (ou orthonormé). 

Quelques propriétés élémentaires du point. 

La géométrie analytique exprime les propriétés d’un 
point (situation, distance, etc.) par des relations entre 
ses coordonnées. Voici quelques propriétés élémentai¬ 
res que le lecteur vérifiera aisément en faisant les 
figures correspondantes. On choisira un repère carté¬ 
sien affine s’il ne s’agit pas de propriétés métriques, et 
un repère orthonormé s’il s’agit de propriétés métri¬ 
ques. 



Traduction 

Traduction 

Situation du 

analytique 

analytique 

point M 

dans le plan 

dans l’espace 


xOy 

Oxyz 


M(x, y) 

M(x, y, z) 

Le point M est 
confondu avec 



l’origine. 

o 

II 

II 

X 

x 

II 

II 

N 

II 

O 

Le point M est 
sur l’axe Ox. 

y = o 

O 

II 

N 

II 

Le point M est 
sur l’axe Oy. 

x = 0 

O 

II 

N 

II 

X 

Le point M est 
sur l’axe Oz. 

— 

O 

II 

II 

X 

Le point M est 
dans le plan xOy. 


z = 0 

Le point M est 
dans le plan xOz. 

_ 

II 

o 

Le point M est 
dans le plan yOz. 

— 

x = 0 

En géométrie 

dans l’espace : 

Le point M est 
dans le premier 
bissecteur. 


x = y 



(z quelconque) 

Le point M est 
dans le deuxième 



bissecteur. 

— 

x = - y 



(z quelconque). 


Étant donné deux points, A{x v y 1t zj et S(x 2 , y 2 , z 2 ), 
la définition de la somme vectorielle permet d’écrire : 

AB = OB - OA , * (5) 


d’où, en projetant cette relation sur les axes, les 
composantes, X, Y et Z, du vecteur AB : 

X = -x 2 - x, , Y = y 2 - y, , Z = z 2 - z, (6) 
et 

AB = Xi+ Yj+ Zk ; (7) 

(dans le plan, Z= 0). 



Composantes d’un vecteur AB (dans le plan). 
Les composantes X et Y sont des nombres alg ébri- 
ques qui mes uren t respectivement les vecteurs A' B' 
et A" B sur les axes Ox et Oy. 

Si le point A était confondu avec l’origine, les 
composantes du vecteur ÂB seraient les coordon¬ 
nées du point B dans le repère considéré. 


Coordonnées polaires Idans le plan). 

Définition. 

Soit un point O, appelé pôle, et un axe orienté x' Ox, 
appelé axe polaire ; supposons choisi un sens positif 
des rotations dans le plan. Considérons un point M et 
orientons arbitrairement la droite OM ; soit Ou l’axe 
obtenu. Le point M est déterminé si l’on se donne : 

— la valeur, 0, de l’angle (Ox, Ou), 

— la valeur algébrique, r, du segment OM. 

Les nombres r et 0 sont les coordonnées polaires du 

point M ; r s’appelle le rayon vecteur, 0 l’ angle polaire, 
et l’on a 

OM = ru, (1) 

u étant le vecteur unitaire de l’axe Ou. 

Inconvénient des coordonnées polaires. 

A tout couple (r, 0) correspond un point M et un 
seul ; par contre, à un point M correspondent une 
infinité de coordonnées polaires, comme l’explique la 
figure ci-dessous. 


Un point M possède une infinité de coordonnées polaires. 

I - OM = r est positif ; Ox s’applique sur Ou par rotation d’angle 0, ou 0 + 2 m, ou, d’une manière générale, 

0 + 2 km. 

II - OM = r est négatif ; Ox s’applique sur Ou par rotation de 0 + m, ou 0 + 3m, ou, d’une manière générale, 

0+(2k+1)m. 
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COORDONNÉES POLAIRES ET DIVERSES 


Toutes les coordonnées du point M sont donc 
englobées dans les deux expressions suivantes : 

6 + nir et (- 1) n r. (2) 

Si n est pair, (- 1) n est égal à + 1 et l’on se trouve 
dans le premier cas de figure ; si n est impair, 
(- 1) n = — 1, il faut changer r en - r et l’on se trouve 
dans le second cas. 

Ainsi donc, il n’y a pas un seul couple (r, d) pour un 
point M , mais une infinité de couples possibles : la 
correspondance entre les points du plan et les coor¬ 
données polaires n’est donc pas biunivoque. 

Relations entre coordonnées polaires et coordonnées 
cartésiennes. 


Associons à l’axe Ox un axe Oy perpendiculaire à 
Ox, tel que le repère Oxy soit orthonormé. On a 
immédiatement, dans le triangle rectangle OPM (voir 
P- 90), 

r x = r cos 0 ; 

\ y = r sin 0. 

et : 


(3) 


= x + y 
x 


(théorème de Pythagore) ; 


(4) 


cos 6 = — , sin 6 = — , (d’où d ). 
r r 



Passage des coordonnées polaires aux coordon¬ 
nées cartésiennes, et réciproquement. 


• Remarque : Le passage des coordonnées 
polaires (r, 0) aux coordonnées cartésiennes (x, y) est 
immédiat ; le passage inverse est plus délicat. En effet, 
l’angle 0 est déterminé modulo 2 t r, ce qui impose de le 
définir à la fois par son cosinus et par son sinus (voir 
p. 90). 


Autres systèmes de coordonnées. 

Coordonnées cylindriques (ou semi-polaires). 

Considérons dans l’espace un repère orthonormé 
Oxyz et un point M, de cote z, qui se projette en m sur 
le plan xOy. Appelons (r, 0) les coordonnées polaires 
de m par rapport au système de pôle O et d’axe 
polaire Ox ; les trois nombres r, 0, zsont les coordon¬ 
nées cylindriques du point M. 



La position d’un point sur cet « écran radar » est 
définie par ses coordonnées polaires, dans un sys¬ 
tème dont l’origine est le centre de l’écran. 


Coordonnées sphériques. 


On peut aussi déterminer le point M de l’espace en 
associant à chaque point M une sphère de rayon 
OM = R sur laquelle on se donne un grand cercle et un 
demi grand cercle perpendiculaires : l 'équateur et le 
méridien origine. La position de M est définie par les 
nombres 0, y, R , qui désignent respectivement la 
longitude (0), la colatitude (y) et le rayon {R) de la 
sphère. 

La longitude se mesure à partir du méridien origine, 
sur lequel on a choisi un sens de parcours ; la colati¬ 
tude est le complément à 90° de la latitude, A, du point, 
mesurée à partir de l’équateur. Sur la figure ci-des¬ 
sous, où les deux grands cercles origines ont été tracés 
en bleu, on a : 

f longitude = 0 = arc mM ^ 

| colatitude = y = ^ — A . 


On peut associer à la sphère un trièdre euclidien ; les 
coordonnées du point M dans ce repère sont 
(x, y, z) ; les coordonnées sphériques sont reliées aux 
coordonnées cartésiennes par les relations suivantes : 


\ x = R sin y cos 0 , 


1 y = R sin y sin d , 

(2) 

[z = R cos y 


R = Vx 2 + y 2 + z 2 . 

(3) 


Coordonnées barycentriques. 


Le lecteur est prié de revoir la définition du barycen- 
tre d’un système de points p. 82. 


Coordonnées sphériques. 


Coordonnées cylindriques. 

Ce système tire son nom du fait que la seconde 
coordonnée (r) de tous les points situés sur la surface 
cylindrique de révolution d’axe Oz et de rayon r est la 
même. 




Choisissons trois points fixes, A Al A 2 et A 3 , dans le 
plan, et considérons un point M quelconque du plan. Il 
est toujours possible de trouver trois nombres, x lP x 2 et 
x 3 , tels que, quel que soit le point O choisi dans le 
plan, on ait 

xi 04, + x 2 OA 2 + x 3 OA 3 

OM =------, (4) 

x^ + x 2 + x 3 

c’est-à-dire tels que M soit le barycentre des points A lP 
A 2 et A 3 affectés des coefficients x 1t x 2 et x 3 . 

Inversement, étant donné trois nombres x 1t x 2 et x 3 , 
il leur correspond un point M et un seul tel que 
l’égalité précédente soit vérifiée. Ces trois nombres 
sont appelés les coordonnées barycentriques du 
point M. 

Comme le barycentre d’un système de points affec¬ 
tés de coefficients x 1f x 2 , ... ne change pas si ces 
coefficients sont multipliés par un même nombre 
k ^ 0, les coordonnées barycentriques d’un point M 
sont définies à un facteur k près : on exprime cela en 
disant qu’elles sont homogènes. 

On définit de façon analogue, avec quatre points, A v 
A 2 , A 3 et A a , les coordonnées barycentriques d’un point 
dans l’espace. 


PROBLÈMES FONDAMENTAUX 
EN GÉOMÉTRIE ANALYTIQUE. 

Dans ce qui précède, nous avons appris à traduire 
par ses coordonnées la situation d’un point M dans le 
plan ou dans l’espace. Pour que la géométrie analyti¬ 
que soit un instrument commode, il faut que nous 
apprenions à traduire algébriquement les notions fon- 
damentâles suivantes : 

— le produit scalaire de deux vecteurs ; 

— le produit vectoriel de deux vecteurs ; 

— la mesure des distances, des aires et des 
volumes ; 

— la définition d’une direction et de l’angle de 
deux directions (orientées ou non). 

Ces opérations fondamentales sont un encodage : il 
s’agit d’établir des formules qui soient toujours vala¬ 
bles et qui remplacent avantageusement et d’une façon 
très générale les raisonnements géométriques. Bien 
entendu, les mathématiciens ne se servent de la géo¬ 
métrie analytique que dans les cas où le calcul donne 
des résultats plus rapides que la considération des 
figures : pour déterminer la médiatrice d’un segment, il 
est préférable d’utiliser — rapidement — la construc¬ 
tion géométrique élémentaire plutôt que d’écrire une 
équation ; mais, en général, pour rechercher un « lieu 
géométrique », il sera plus opportun — et plus systé¬ 
matique — d’employer la géométrie analytique. 

Expression du produit scalaire 
de deux vecteurs. 


Repère euclidien. 

Le produit scalaire faisant intervenir une propriété 
métrique (l’angle des deux vecteurs), nous avons inté¬ 
rêt à nous placer dans un repère euclidien (c’est-à-dire 
orthonormé). 

Appelons X, Y, Z les composantes d’un vecteur V et 
X', Y\ Z' les composantes d’un vecteur V' On a 

V=Xi+Yj+Zk (1) 

et 

V = X i + Y'j + Zk . (2) 

Le produit scalaire V . V s’écrit donc : 

V V = (X/+ Yj+ Zk) . (X7 + Y'j +Z’ k). (3) 

En effectuant ce produit, on va trouver : 

— d’une part, des termes comme : 

XX'/. i= XX’i 2 ; (4) 

mais, du fait que # 2 = 1 (le module de/est égal à 1) : 

XX' i 2 — XX' ; (5) 

— d’autre part, des termes comme : 

Xi. Y'j = XV# j ; (6) 

mais/et/étant des vecteurs orthogonaux (ils orientent 
les axes rectangulaires Ox et Oy), leur produit scalaire 
est nul, donc : 

Xi . Y j = 0 . (7) 

Ainsi, en développant les calculs, on obtiendra 
comme expression du produit scalaire : 

V V' = XX' + YY' + ZZ' . (8) 
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Dans un repère affine (coordonnées obliques), les 
produits / /, etc., ne sont pas nuis, puisque les axes ne 
sont pas rectangulaires ; l’expression du produit sca¬ 
laire ferait alors intervenir les angles des axes de 
coordonnées et serait plus compliquée. 

Applications. 

Nous pouvons, dès maintenant, « encoder » quel¬ 
ques énoncés géométriques, en traduisant algébrique¬ 
ment les propriétés du produit scalaire. Nous choisi¬ 
rons un repère euclidien, puisqu’il s’agit de géométrie 
métrique. 


Relations géométriques 

Traduction analytique 

Grandeur géométrique 
du vecteur V 

V V= \ V 2 \ = x 2 + Y 2 + Z 2 , 

puisque 

X= X', Y= Y', Z=Z' , 

donc 

Il v\\ = Vx 2 + r + z 2 . 

Le vecteur V est orthogo¬ 

XX' + YY' + ZZ' = 0 . 

nal au vecteur V 

(L’orthogonalité des deux 
vecteurs entraîne la nullité 
du produit scalaire). 

Angle 0 de deux demi- 

V. V = XX' + YY' + ZZ' ; 

droites parallèles aux vec¬ 

mais, d’après la définition 

teurs V et V et de même 

du produit scalaire, on a 

sens qu’eux. 

aussi 

V Y = || V\\.\\ VJ.cose, 

d OU COS 0 -Jyy J,,.,. 

avec 

V V = XX' + YY' + ZZ', 

Il v\\ = Vx 2 + v 2 + z 2 

et II V II = VX ' 2 + Y' 2 + Z' 2 


Traduction analytique de quelques relations géo¬ 
métriques 


Expression du produit vectoriel. 

Composantes du produit vectoriel. 

(Si le lecteur a oublié ce qu’est le produit vectoriel, 
qu’il se reporte à la p. 87). 

Soient les vecteurs Vet V, de composantes (X, Y, Z) 
et (X', Y', Z'). En procédant, comme pour le produit 
scalaire, dans un repère euclidien, on démontre que les 
composantes A, pe t v, du produit vectoriel W = Vx V 
sont : 

A = YZ' — ZY' , p = ZX' - XZ', v = XY' 

ce qui permet d’écrire : 

IV = vx V = A i+pj+ vk 
et 

-W=VxV=- A/- p / vk (3) 


- vx\ (1) 
( 2 ) 


Utilisation des déterminants. 


Nous avons défini, p. 59, les règles du calcul des 
déterminants. Rappelons qu’un déterminant D compre¬ 
nant quatre termes écrits de la sorte : 


D = 


a v b 
c d 


(4) 


est un nombre réel qui se calcule selon la règle 
D = ad - bc. 

Or les composantes A, p et v du produit vectoriel 
peuvent s’écrire précisément sous cette forme : 


1 Y 

A = | y , 

Z I 
Z' 1 

= D x , 


I Z 

1 Z' 

X I 
X' 1 

= D y , 


v 

II 

* * 

Y 

Y' 

= D z . 


(5) 


(Noter que A, composante selon Ox, ne contient ni X, ni 
X' ; p, composante selon Oy, ne contient ni Y, ni Y' ; v , 
composante selon Oz, ne contient ni Z, ni Z'). 

Calcul d'aires. 

• Aire du parallélogramme. Soit un parallélo¬ 
gramme ABCD, dont les sommets sont dans cet ordre 


(voir figure). Nous avons vu, p. 87, que le produit 
vectoriel AB x AC est un vecteur W dont la norme est 
égale à l’aire S du parallélogramme ABCD ; on a donc : 

||IV|| = S. (6) 



L’aire du parallélogramme est égale à la norme du 
produit vectoriel. 


Pour exprimer analytiquement l’aire de ce parallélo¬ 
gramme à partir des coordonnées (x 1; y lT z y ) du point 
A, des coordonnées (x 2 , y 2 , z 2 ) du point B et des 
coordonnées (x 3 , y 3 , z 3 ) du point C, on procède comme 
suit : 

1 - On détermine les composantes, X, Y et Z, X', 
V" et Z', des vecteurs AB et AC ; on trouve : 



fx=x 2 -x 1 , 


composantes de AB : 

{ Y = y 2 - y,, 

Lz = z 2 -z,, 

(7) 


C X — x 3 x 1 , 


composantes de AC : 

] Y' = y 3 -y,, 

KZ' = z 3 -z,. 

(8) 

2 - On calcule 

les composantes, A, p, 

v, du 


produit vectoriel ABx AC à l’aide des formules (1) du 
paragraphe B, a). 

3 - L’aire du parallélogramme ABCD est 

S = VA 2 + p 2 + v 2 . (9) 


• Aire du triangle ABC. Un triangle est la moitié 
d’un parallélogramme ; par conséquent, avec la nota¬ 
tion précédente, l’aire cherchée serait : 


aire du triangle ABC 


\/ \ 2 + p 2 + v 2 
2 


( 10 ) 


Volume du parallélépipède. 

Considérons dans l’espace trois vecteurs, OA, OB et 
OC, pris dans cet ordre. La valeur arithmétique du 
volume du parallélépipède construit sur ces trois vec¬ 
teurs est égale au produit de la base par la hauteur. Or 
nous venons de voir que l’aire de la base est égale à la 
norme du produit vectoriel OB x OC. Quant à la 
hauteur du parallélépipède, elle est la projection de 
OA sur la perpendiculaire au plan OBC, c’est-à-dire 
sur la droite qui porte le produit vectoriel OB x OC. 
Donc, en appelant d l’angle que fait ce produit vectoriel 
avec OA 

Hauteur = || OA || cos 0. (11) 

Le volume cherché est donc, en valeur absolue, le 
produit suivant (en appelant IV le produit vectoriel 

OB x OC) : 

Volume du parallélépipède = || 1V|| || OA || cos 0 , 

c’est-à-dire que le volume du parallélépipède est égal à 
la valeur absolue du produit scalaire : 

IV. OA = OA . (OB x OC) (12) 

Si l’on appelle 

a, a', a" les composantes de OA, 

b, b', b" les composantes de OB, 

c, c', c " les composantes de OC, 


LES VECTEURS GÉOMÉTRIQUES 

le volume cherché a pour valeur absolue 
| a(b ' c" - c' b") + a\b" c - c" b) + a"(bc' - cb') |. (13) 

Si l’on supprime le symbole « valeur absolue », 
c’est-à-dire si l’on considère l’expression précédente 
avec son signe, elle représente, par définition, la valeur 
algébrique du volume du parallélépipède. On désigne 
souvent ce volume algébrique sous la forme 
(OA. OB . OC), les vecteurs étant pris dans cet ordre 
(à cause de la non-commutativité du produit vectoriel). 
On remarque que (OA. OB . OC) est égal au détermi¬ 
nant dont les lignes contiennent les composantes de 
OA, OB et OC 


Mesure des angles. 

Détermination d'une direction. 

Pour connaître la direction d’une droite D, il suffit de 
connaître les composantes, a, b et c, d’un vecteur V 
quelconque porté par cette droite. Comme la direction 
est une propriété affine, on prendra un repère affine. 
Les nombres a, b et c constituent les paramètres 
directeurs de la direction D ; un autre vecteur V de D 
aurait pour composantes a', b', c', telles que : 


et (a', b', c') est aussi un système de paramètres 
directeurs de D. 

Quand D est orientée, on choisit de préférence le 
vecteur unitaire de D pour caractériser la direction en 
cause. Dans un repère euclidien, les composantes 
(/, m, n) de ce vecteur ne sont autres que les cosinus 
-des angles que fait la droite D avec les axes (voir figure 
ci-après). 



Cosinus directeur d’une droite dans le plan (repère 
euclidien). 

Les composantes OA et OB se calculent immédia¬ 
tement à partir de la définition des lignes trigonomé- 
triques, en tenant compte de ce que 

(ôy.D) = -f + (ô2,d) = -f + e . 


Dans un système euclidien Oxyz, on aurait : 

/ = cos (Ox, D), m = cos (Oy, D) et n = cos (Oz, D). 
Dans le plan, compte tenu de la relation 

cos ( - ^ + 0 ) = cos - 0 ) = sin 0 , (2) 

les paramètres directeurs de D sont cos 0 et sin 0 
(figure ci-dessus). 


Angle de deux directions. 

• Les deux directions sont orientées. Nous 
choisissons un repère euclidien, puisqu’il s’agit de 
géométrie métrique. Soient D et D ' deux droites orien¬ 
tées par les vecteurs unitaires f/et u', de composantes 
(/, m, n) et (/', m', n'). Comme nous ne nous intéres¬ 
sons qu’à la direction de ces droites (et non pas à leur 
position dans l’espace), nous pouvons supposer 
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TRANSFORMATIONS DE COORDONNÉES 


qu’elles passent toutes deux par l’origine O (sinon, on 
mènerait par O deux parallèles à ces directions et l’on 
raisonnerait sur ces deux parallèles). Le produit sca¬ 
laire u v est égal, par définition, à : 

u v = || u || || v || cos (D, D') = 1 x 1 x cos 0 = cos 0 
et, d’autre part (voir ci-dessus), 

u v = II' + mm' 4- nri ; (3) 

donc : 

cos 6 = II' + mm' + nri , avec 0 G tt . 

Si 0 était supérieur à it, on calculerait cos (D'_^D) au 
lieu de cos (Z?, Ü'), puisque cos (Z?', Ü) = cos (D, Ü'). 

• Les directions ne sont pas orientées. Par 
définition, l’angle de deux droites non orientées est 
l’un quelconque des angles fl ou jt - 0 (voir p. 90). Or 
on montre, en trigonométrie, que : 

cos (tt - 0) = - cos G et sin (tt - 0) = sin 0. 

Il est donc préférable, dans le cas de droites non 
orientées, de définir 0 par son sinus, en utilisant le 
produit vectoriel, IV = V x V, de deux vecteurs quel¬ 
conques appartenant aux droites D et D' et de compo¬ 
santes respectives (a, b , c) et (a', ri, c'). On a, en 
effet, en appelant S l’aire du parallélogramme construit 
sur V et V : 



et : 

S = || Mf II = Il Vx v II = VA 2 + IX 2 + v 2 , 

(4) 


S = base x hauteur = || V|| || V || sin 8 , 

(5) 

d’où 



sin 0 

11*11 

Il vil II v II 



\^\ 2 + /JL. 2 + V 2 

Va 2 +b 2 +c 2 .Va' 2 4b' 2 +c' 2 

(6) 


Changement de repère. 



Antoine Pevsner (1884-1962) : Construction de surface développable (1938.) : l’objet du mathématicien devient 
objet d’art. (Pevsner est à l’origine du mouvement plastique appelé constructivisme.) 


Le problème. 

Ce qui précède laisse entrevoir au lecteur l’intérêt de 
la géométrie analytique. Schématiquement, un pro¬ 
blème de géométrie consiste à déterminer certains 
points, ou certains ensembles de points, à partir de 
données concernant d’autres points ou d’autres 
ensembles de points. Pour le résoudre analytiquement, 
on cherche à établir des équations dans lesquelles les 
coefficients (nombres connus) sont les coordonnées 
des points connus, et dont les inconnues sont les 
coordonnées du (ou des) points à déterminer. Les 
calculs précédents montrent comment on exprime 
facilement les angles et les distances à l’aide des 
coordonnées des points ou, ce qui revient au même, à 
l’aide des composantes des vecteurs associés à ces 
points. 

Il est parfois utile de changer de repère, soit pour 
simplifier les calculs, soit pour mettre en évidence 
certains parallélismes de formules. Les coordonnées 
(x, y, z) d’un point M dans un repère deviennent 
(x\ y', z') dans un autre repère, et il existe entre elles 
une relation caractéristique du changement de repère 
effectué, qui permet de calculer les unes à partir des 
autres et inversement. 


Expression matricielle du problème. 


coordonnées (x, y, z) telles que : 

OM = xi+ yj+ zk. (1 ) 


Nous désignerons ces coordonnées par une matrice 
~ x~ 


unicolonne X= y 


(une matrice, rappelons-le, est un 


z 


tableau ordonné de nombres ; voir n° 512.7, C). 
Considérons un autre repère affine, caractérisé par un 
point O' dont les coordonnées dans Oxyz sont (a, (3 , y) 
et par trois vecteurs unitaires O'A = i ', O f B'=/', 
O' C' = k'. Comme nous nous plaçons dans le cas le 
plus général, nous supposerons que ces vecteurs sont 
différents des vecteurs /,/et k : ils n’ont ni même 
direction, ni même norme (même grandeur géométri¬ 
que). Pour les définir, nous donnerons leurs compo¬ 
santes par rapport au système Oxyz : 


— /' a pour composantes (a, b, c), d’où : 


i' = ai+bj+ck ; (2) 

— /' a pour composantes (a', ri, c'), d’où : 

/' = a i + ri j + c'k ; (3) 

— k' a pour composantes (a", b", c"), d’où : 

k ' = a"# + ri’j + c"k . (4) 


Soit un repère affine quelconque Oxyz, défini parles Nous aurons donc, en appelant (x , y', z') les coor- 
vecteurs unitaires OA = i sur Ox, OB = j sur Oy et données de M dans le second repère : 

OC = k sur Oz. Un point M a, dans ce système, des O' M = x'i' 4- y'j' + z'k . (5) 


Ces coordonnées constituent la matrice unicolonne 


X' = 



Si nous appliquons la relation de Chasles aux vec¬ 
teurs ici en cause, nous pouvons écrire : 

OM = OO +OM (6) 

mais, si nous écrivons la relation (5) ci-dessus en y 
remplaçant k' par leur expression en fonction de /, 
/, k, nous obtenons : 

O' M = x'(ai+ bj+ ck)+ ÿ(a'i + ri j + c'k) . 

+ z'(a"i + b" j + c" k), ' ’ 

soit, en groupant les termes en /, /, k, 

O M = (ax' + a' y' + a" z’) i + (bx f + ri y' + b" z') j 

+ (ex' + c' ÿ + c" z')k . * ' 

Les sommes entre parenthèses désignent les 
composantes du vecteur O' M par rapport au repère 
Oxyz ; d’autre part, les composantes du vecteur OO' 
étant, dans ce repère, (a, (3, y) et celles du vecteur OM 
étant (x, y, z), l’égalité vectorielle (6) correspond aux 
trois égalités suivantes entre les composantes de ces 
vecteurs : 

f x = « + (ax’ + a' y'-h a" z '), 

< y = (3 + (bx' 4- ri y' + b" z'), (9) 

[z = y 4- ( ex' 4- c' y' + c " z '). 
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TRANSLATION ET ROTATION DES AXES 


Or, si le lecteur veut bien se reporter aux pp. 59-62, 
où l’on donne les règles du produit matriciel, il 
constatera que les termes entre parenthèses dans le 
second membre de ces trois dernières égalités ne sont 
autres que les éléments du produit de matrices 


( 10 ) 


“a 

a' a"~ 1 

1 

PH 


~ax' + a'y' + a"z'~ 

b 

_c 

b' b "\ 
c ' c " J 

H 

ItJ 

— 

bx ' + b ' y ' + b" z' 

- ex ' + c ' y ' + c " z 


Appelons donc P et A les matrices 


“a 

a ' 

a " 


a 

b 

b' 

b" 

et 

P 

_c 

c ' 

c 


-y- 


qui sont, respectivement, la matrice des composantes 
de /', /', k par rapport à /, y, k et la matrice des 
coordonnées de O' par rapport à Oxyz. Les trois 
équations établissant les formules de changement de 
coordonnées se résument en une seule équation matri¬ 
cielle : 


X = A + PX' ; 


X' = A' + P 1 X , 


P = 


1 

0 

LO 


(13) 


La relation matricielle X = A + PX' correspond donc 


(14) 


x 


a 


“i 

0 

°i r*'i 

y 

= 

P 

+ 

0 

1 

O x y' 

_ z _ 


-y - 


_0 

0 

iJ Lz'_ 


c’est-à-dire 

x = a + x' 


(15) 


y = p + ÿ, z = y + z'. 

Sur la figure ci-après on a donné un exemple de 
translation d’axes dans le cas d’un repère plan que l’on 
déplace par translation en x' O' y' ou x" O" y", les axes 
Ox, Ox' et Ox" étant confondus. Dans un cas comme 
dans l’autre, on a /=/' =/" et /=/' =/", ce qui corres¬ 
pond à la matrice de passage 


1 0 
0 1 


(16) 


Avec les unités indiquées sur la figure, les coordon¬ 
nées des points O' et O" sont données par les matrices 


A ' = 


et A 


- [ o] 


On a donc : 

— pour O' x' y' z' 


1 0 
0 1 


d’où : 


d’où : 


x = 4 + x ' et y = y' ; 
pour O" x" y" z" : 

[;]-[-.*] 4 : ?]»[;- 


x = - 2 + x " et y = y". 


(17) 

(18) 

(19) 

( 20 ) 

( 21 ) 



( 11 ) 


P s’appelle la matrice de passage. 

Pour exprimer les coordonnées (x', y', z') en fonc¬ 
tion de (x, y, z), on aurait la relation 


( 12 ) 


A' étant la matrice des coordonnées de O par rapport à 
O'x'y'z' et P 1 l’inverse de la matrice P. 

Ces formules semblent peut-être abstraites et 
compliquées. Nous allons en voir l’intérêt à propos de 
quelques changements de repère classique. 

Translation des axes. 

Ce changement de coordonnées consiste à déplacer 
le trièdre de référence, les axes restant orientés de la 
même façon par les vecteurs /' = /, /' = / et k' = k. Les 
composantes de ces vecteurs selon le repère initial 
sont donc (1,0, 0) pour /', (0, 1,0) pour /' et (0, 0, 1) 
pour k', soit la matrice de passage : 


riante on a A = 


pour /' : 


pour /' : 


a = cos a, 


b = sin a ; 


a = - sin a, 


b' = cos < 


( 22 ) 


(23) 



Rotation d’un repère euclidien dans le plan. 

Les composantes, (a, b), (a', b'), des vecteurs uni¬ 
taires i' = OA' et j' = OB' s’obtiennent en projetant 
ces vecteurs sur les axes Ox et Oy. 


d’où : 


et : 


P = 


[ cos a — sin a 

Sin a COS a J 

[ X I _ I COS a —sin al I” 

y J [^sina COS a J | 


:]■ 


ce qui donne (règle du produit matriciel) : 

i x = x' cos a - y' sin a 
y = x' sin a + y'cos a . 

D’autre part, l’inverse de P étant : 


(24) 


(25) 


(26) 


p i _ j cos a sin al 
L-sina COS a J 


le lecteur vérifiera aisément que 

P 1 x P 


h 0 

L° \ 


(27) 


on a : 

X' = P 1 X ; 

(28) 

soit : 

[ 

x'1 r COS a sin al T xl 
y'J |_-sina cos a J |^yj 

(29) 

d’où : 

j x' = x cos a + y sin a ; 

) y' = -xsina+y cos a. 

(30) 


Translation des axes en géométrie plane. On a 
choisi comme repère euclidien initial le système xOy 
(en bleu) ; la translation OO' (OO' = + 4) conduit au 

repère x' O' y' ; la translation OO" (OO 7 ' = - 2) conduit 
au repère x" O" y". 


Rotation d'un repère euclidien dans le plan. 

Soit Oxy le repère ; une rotation d’angle a dans le 
sens positif l’amène en Ox'y'. L’origine étant inva- 

0 

= 0. La matrice de passage s’écrit 


en inscrivant dans chacune de ses colonnes les 
composantes de i et de j par rapport à Oxy. On a 
évidemment : 


LA DROITE ET LE PLAN. 

Généralités sur la représentation 
des lignes et des surfaces. 

Nous en savons assez, maintenant, pour traduire en 
langage algébrique les données d’un problème de 
géométrie. Examinons séparément le cas des lignes et 
celui des surfaces. 

Représentation d'une ligne plane. 

Une ligne plane est une figure tracée dans un plan ; 
elle peut être droite ou courbe. 

Pour chacune de celles que nous serons conduits à 
envisager, il existe, entre les coordonnées x et y de 
tous ses points, une relation caractéristique appelée 
équation de cette ligne. Ainsi, dans un repère euclidien 
d’origine O, tous les points M(x, y) d’un cercle de 
centre O et de rayon R vérifient la relation de Pytha- 
gore x 2 + y 2 = R 2 . Cette relation peut s’écrire de deux 
façons : 

— soit sous la forme y = ± VR 2 - x 2 : c’est ce 
qu’on appelle l'équation explicite de la ligne consi¬ 
dérée ; 

— soit sous la forme x 2 + y 2 - R 2 = 0 : c’est ce 
qu’on appelle l'équation implicite de la ligne consi¬ 
dérée. 

Plus généralement, on écrira : 

y = f(x) (équation explicite) (1) 

ou 

F(x, y) = 0 (équation implicite). (2) 

On peut encore définir une ligne plane en exprimant 
les coordonnées x et y de l’un quelconque de ses 
points en fonction d’une grandeur variable t et écrire : 

x=f(t) et y = g(t) (3) 

(on choisit deux lettres distinctes f et g , car les 
relations entre x et f d’une part, y et f d’autre part ne 
sont pas les mêmes). Ce mode de représentation 
s’appelle représentation paramétrique ; t est le para¬ 
mètre. 

Représentation d'une surface. 

Une surface est définie par une relation entre les 
coordonnées x, y et z d’un quelconque de ses points. 
On écrira soit : 

z= f(x, y) (équation explicite par rapport à 

x et y), (4) 

soit : 

F(x, y, z) = 0 (équation implicite). (5) 

On peut aussi se donner les équations paramétri¬ 
ques d’une surface en utilisant deux paramètres, s et 
t : 

x = f{s , t), y = g(s, t), z = h{s, t). (6) 


Représentation d'une ligne dans l'espace. 

Une ligne dans l’espace peut être considérée comme 
l’intersection de deux surfaces : le cas le plus simple 
est celui d’une droite, qui est l’intersection de deux 
plans. Les modes de représentation d’une ligne quel¬ 
conque dans l’espace sont rappelés à la p. 149. 


Géométrie affine de la droite. 

Nous étudierons d’abord la représentation d’une 
droite dans un repère affine (axes obliques), pour 
examiner les propriétés qui ne font intervenir ni la 
mesure des distances, ni la mesure des angles. 

Quand on se donne une droite, en géométrie plane, 
on la définit : 

— soit comme la droite reliant deux points 
déterminés M 1 et M 2 ; 
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GÉOMÉTRIE AFFINE DE LA DROITE 

— soit comme la droite passant par un point M, 
et parallèle à une direction donnée par un vecteur V. 

Dans un cas comme dans l’autre, établir l’équation 
de la droite, c’est trouver la relation qui existe entre les 
coordonnées x et y d’un point M quelconque de la 
droite. Nous allons donner le détail des calculs, afin de 
faire comprendre au lecteur le principe de la méthode 
employée. 


Premier cas : équations barycentriques de la droite. 


La droite D est définie par les deux points, y,) 

et M 2 (x 2 , y 2 ). Nous allons nous servir de la notion de 
barycentre, étudiée p. 82. Un point M{x, y) quelconque 
de D peut être considéré comme le barycentre des 
points M a et M 2 affectés respectivement des coeffi¬ 
cients 1 et X (X : nombre réel quelconque). Cela 
signifie que, quelle que soit l’origine O choisie, on a 
(voir p. 83) 

QM OMl + A ° M (1) 

1 + À 


Par exemple, si le point M est le milieu du segment 
M, M 2 , on prendra A = 1 et l’on aura 


OM = 


OM, + OM 

2 


( 2 ) 


(c’est-à-dire que OM est la demi-diagonale issue de O 
du parallélogramme construit sur OM 1 et OM 2 ). 

Comme le barycentre d’un système de points est 
indépendant de l’origine choisie, on peut prendre 
comme origine le point M lui-même ; on a alors 
OM = 0 et l’équation vectorielle (1) s’écrit : 

MM + \MM 2 ... 


équation équivalente à : 

MM, + A MM 2 = 0. (4) 

Si A = - 1, cette équation s’écrit MM, - MM 2 = 0, ce 
qui n’a de sens que pour M éloigné à l’infini sur la 
droite D(M 1( M 2 ). 

Pour établir l’équation de D, on va projeter l’équa¬ 
tion vectorielle (1) sur chacun des axes de coordon¬ 
nées Ox et Oy parallèlement à l’autre, c’est-à-dire 
qu'on va remplacer chacun des vecteurs OM, OM,, 
OM par sa composante selon l’axe sur lequel on le 
projette : 

— sur Ox, on remplace OM par x, OM, par x, et 
OM 2 par x 2 ; 

— sur Oy, on remplace OM par y, OM, par y, et 
OM 2 par y 2 ; 

on obtient ainsi deux équations : 


x 1 + Ax 2 _ y i + Ay 2 
1 + A ’ y ~ 1 -F A 


(5) 


qui sont la traduction algébrique de l’énoncé géométri- 


revient à écrire : 


M M = kM M 2 ou jjp 

s|s 

II 

x- 

(6) 

composantes de M, M : < 

^ X 

1 1 

^ X 

(7) 

composantes de M, M 2 : j 

s 

1 1 
^ * 

(8) 


donc l’équation (6), projetée parallèlement aux axes, 
donne : 

_ x - Xi 

sur Ox : -= k (9) 


sur Oy : -—— = k , (10) 

y2-y i 


d’où l’équation cartésienne de la droite D : 

x - Xt = y - yi 
x 2 -Xi y 2 -yi’ 


équation qui peut s’écrire aussi sous la forme sui¬ 
vante : 


D = 


x y 1 

Xi yi 1 

x 2 y 2 1 


= 0, 


( 12 ) 


D étant un déterminant (voir p. 59) pour les règles de 
calcul d’un déterminant. 

Cas particulier intéressant : Le point M, est sur Ox 
(x 1 = a, y, = 0) et le point M 2 sur Oy (x 2 = 0, y 2 = b). 
L’équation (11) s’écrit alors, comme le lecteur le 
vérifiera aisément, 

-+£-1=0. (13) 

a b 


Deuxième cas. 

La droite est définie par le point M,{x,, y,) et par un 
vecteur directeur V de composantes p et q selon les 
axes. Un point M(x, y) quelconque appartenant à la 
droite D est tel que le vecteur M, M et le vecteur V 
aient même direction (voir figure ci-dessous), ce qui 
s’écrit : 

M,M = pV (p = réel), (14) 

d’où, par projection sur chacun des deux axes parallè¬ 
lement à l’autre, 

x-x, = pp et y - y, = pq . (15) 

On en tire : 

— les équations paramétriques de D : 

x = x, + pp y = y, + pq (16) 



que : « la droite D passe par les points M, et M 2 ». 
Nous remarquons que les coordonnées x et y d’un 
point A4 de D sont exprimées en fonction d’un paramè¬ 
tre A : les équations précédentes sont donc des équa¬ 
tions paramétriques de la droite D. Comme on a 
considéré le point M comme un barycentre, on dit 
aussi que ce sont les équations barycentriques de la 
droite D. 

Premier cas : équation cartésienne de la droite. 

La droite D étant définie par les deux points Mi et 
M 2 , dire que M appartient à cette droite, c’est dire que 
Mi M 2 et Mi M sont colinéaires (voir p. 86), ce qui 



Équation d’une droite définie par un point et une 
direction. 

— l’équation cartésienne de D : 



• Cas particuliers. 

— Si V est parallèle à Ox, q = 0 et l’équation de 
D est y = yi ; 

— Si V est parallèle à Oy, p = 0 et l’équation de 
D se réduit à x = x v 

• Remarque. Si p ^ 0, on peut poser q/p = m, 
et l’équation (17) devient : 

y-y, = m(x-x,); (18) 


m s’appelle le coefficient directeur de la droite D 
(nous verrons, en géométrie métrique, ce qu’il signifie). 
D’une manière générale, l’équation d’une droite D non 
parallèle à Oy peut se mettre sous la forme : 

y = mx + h, (19) 

m étant son coefficient directeur et h l’ordonnée du 
point où la droite coupe l’axe Oy (x = 0, y = h), appe¬ 
lée aussi ordonnée à l’origine. 

Théorème important. 

Toute droite D d’un plan rapporté à un repère affine 
Oxy est représentée par une équation du premier 
degré 

Ax + By + C = 0 , (20) 

A et B n’étant pas nuis en même temps. 

Nous venons de voir que toute droite non parallèle à 
Oy a une équation de cette forme ; l’équation (19) peut 
en effet s’écrire 

mx — y -F h = 0 . (21) 

Par comparaison entre (20) et (21) on voit que la 
droite d’équation Ax + By +C = 0 a pour coefficient 
directeur et pour ordonnée à l’origine, respectivement 

m = -A e t h = - j. ' (22) 

Enfin l’équation d’une droite parallèle à Oy (x = x 1( 
ou x - x, = 0) est aussi de la forme (20). 

On déduit immédiatement de ce théorème que 
deux droites D et D ' d’équations respectives 
Ax -F By -F C = 0 et A'x+S'y+C'=0 sont parallèles 
(au sens large) si et seulement si : 


(ou BA - AB' = 0). (23) 

A B 


Si, en outre, — = 
A 


ËL 

B 


9L 

C 


elles sont confondues. 


Ce théorème achève notre effort de traduction en ce 
qui concerne la géométrie affine de la droite. Nous 
pouvons dire, dorénavant, en langage géométrique, 
« la droite D » ; en langage analytique, 

« l’équation Ax -\- By + C = 0 » . 

A titre d’exemple (figure ci-dessous), considérons la 
droite D ayant pour équation 4x + y- 6 = 0 dans le 
repère d’origine O et de vecteurs unitaires / et /. 

1 - Les points où la droite D coupe les axes sont 
A{ 3/2, 0) sur Ox et B(0, 6) sur Oy, d’où l’équation 
équivalente de D : 


2 x y 
~ 3 + 6 


- 1=0 




(24) 


2 - Le coefficient directeur de D est 
m = - A/B = - 4/1 = - 4 ; l’ordonnée à l’origine est 
h = 6, d’où l’équation (équivalente) : 

y = - 4 x -F 6 . (25) 

3 - On vérifiera que deux points quelconques, 


Représentation analytique d’une droite (exemple du 
texte). 
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GÉOMÉTRIE AFFINE DU PLAN 


tels P{ 1,2) et 0(5/2,-4), ont des coordonnées qui 
satisfont aux trois relations : 


4 x -F y -6 = 0, 
2x y M 

-3 + ï~ 1=0 ' 

y = - 4 x + 6 , 


(26) 


qui sont des équations équivalentes représentant la 
droite D. 

4 - Réciproquement, la droite passant par les 
points P et Q a pour équation : 


1 


i-' 


-4-2 


(27) 


ou, ce qui revient au même (et qui a l’avantage de 
s’écrire « automatiquement ») : 


D = 


/ 1 
2 1 

4 1 


0, 


(28) ■ 


d’après l’équation (12) ci-dessus. 


La droite dans l'espace (propriétés affines). | 

Dans un repère affine Oxyz, on retrouverait les^ 
résultats précédents, en tenant compte des composan- ^ 
tes selon Oz des égalités vectorielles considérées. On § 
obtiendrait ainsi : M 

— les équations barycentriques d’une droite J 
passant par deux points, M,(x A , y v z A ) et s. 
M 2 (*2. y 2 . z 2 ) : ! I 


Xi -F Àx 2 
1 -F À 


y = 


yi + Ay 2 
i + à 


z i + Az 2 
1 -F A 


(29) 


— les équations cartésiennes de cette droite 

x - x, _ y - y, z — zi 


x 2 - 


y 2 - yi 


5 

^ I 

15 

( 30)5 


— les équations d’une droite passant par /W, * 

(x 1t y u zj et parallèle au vecteur V de composantes s 

(p, q, r) : S ■■ 



X = *1 + PP- y = y 1 + pq, Z = z,- F pr 
(équations paramétriques), ou : 


(31) 


Franz Kupka (1871-1957) : l’un des premiers peintres abstraits ; il a été séduit par la plastique des formes 
géométriques. Ci-dessus : Trois bleus, trois rouges. 


x — x -i 


P 




(32) 


(équations cartésiennes, dites équations normales de 
la droite). 


Représentation affine du plan. 

L’image la plus banale d’un plan est donnée par le 
plateau d’une table supposé sans épaisseur et pro¬ 
longé à l’infini dans toutes les directions. Pour définir 
un plan en géométrie, on peut se donner les éléments 
suivants : 

— trois points non alignés (un trépied est tou¬ 
jours en équilibre, car les trois « points » qui représen¬ 
tent les extrémités de ses pieds déterminent un plan et 
un seul ; par contre, une chaise à quatre pieds peut 
être « boiteuse » si le quatrième pied n’est pas dans le 
plan des trois autres) ; 

— un point et deux directions (représentées par 
deux vecteurs non parallèles). 


Équations barycentriques du plan défini par trois 
points donnés. 

Soient trois points, M^(x A , y : , z^), M 2 (x 2 , y 2 , z 2 ) et 
M 3 (x 3 , y 3 , z 3 ) ; pour traduire algébriquement le fait 
qu’ils déterminent un plan, c’est-à-dire un ensemble de 
points M(x, y, z) tel que — si l’on peut se permettre 
cette comparaison grossière — une chaise dont les 
quatre pieds (supposés infiniment effilés) reposant en 
M, M 2 , M 3 , ne serait pas « boiteuse » (on dit en 
géométrie que les quatre points sont coplanaires), on 
peut procéder comme pour la droite, en considérant M 
comme le barycentre des points M 2 et M 3 affectés 
de coefficients convenables, 1, A, p. On aurait alors, 
vectoriellement, 


OM 


OM ! -F A O M 2 ~F /x OM 3 
1 -F A -F p 


(1) 


d’où les coordonnées barycentriques (à deux paramè¬ 
tres) d’un point du plan : 


x^ -F Ax 2 -f p,x 3 " 
1 + A -F // 
y 1 + Ay 2 -F py 3 
1 -F A -F p 
z 1 + Az 2 “F pz 3 
1 -F A ~F p, 


( 2 ) 


Plan défini par un point et deux directions. 


Soit un plan défini par le point M^(x^, y v zj et deux 
directions non parallèles, V(p, q, r) et V'(p', q', r’). 
Dire qu’un point M appartient au plan (A4 1 ; V, V), c’est 
dire que le vecteur M peut être obtenu en appli¬ 
quant la règle du parallélogramme à deux vecteurs pV 
et p' V , de même direction que V et V (p et p' étant 
deux scalaires), c’est-à-dire qu’on peut écrire : 

M,M= pV+ p V (3) 


Cette équation vectorielle est équivalente aux équa¬ 
tions suivantes, qui font intervenir les composantes de 

M 1 M, V et V 

x - x, = pp + p' p', y-y, = pq + p' q', (4) 

z - z 1 = pr + p' r' ; 

d’où les équations paramétriques du plan : 

x = x, + pp + p' p', y=y,+pq + p’q', (5) 

z = z 1 -F pr -F p' r ', 

et, en éliminant p et p' entre ces équations, l’équation 
cartésienne du plan, qui s’écrit, tous calculs faits, 

(qr' - rq') (x - x,) + (rp' - pr') (y - y,) + 

+ (PQ' - QP') (z-z,) = 0 , (6) 

ou, en utilisant les déterminants, 


x — x, y — y i 
p q 

p' p ' 


Z — Zi 


r 

r' 



(7) 


D’où le théorème : l’équation générale du plan dans 
l’espace, rapportée au repère affine Oxyz, s’écrit : 

Ax+By+Cz+D= 0, (8) 

A, B et C n’étant pas nuis en même temps. 


Développement de la géométrie 
analytique. 

Nous pensons que les observations précédentes 
auront fait comprendre au lecteur quel est le principe 
général de la géométrie analytique. Ce n’est évidem¬ 
ment pas le lieu, ici, de développer les calculs, parfois 
longs et compliqués, qui permettent de traduire algé¬ 
briquement les faits géométriques. Cela exigerait, en 
effet, la rédaction d’un traité de géométrie analytique, 
qui n’est pas notre propos. Néanmoins, pour que le 
lecteur n’ait pas l’impression de rester « sur le seuil » 
d’une théorie dont le développement et les prolonge¬ 
ments sont très importants, nous avons groupé les 
principaux résultats (sans les démonstrations, bien 
entendu) pp. 149-153, où le lecteur trouvera notam¬ 
ment des informations sur les questions suivantes : 

— Géométrie métrique de la droite et du plan. 

— Éléments à l’infini, éléments imaginaires. 

— Propriétés générales des courbes et des sur¬ 
faces. 

— Lieux géométriques. 

— Traduction analytique de quelques transfor¬ 
mations (déplacements, symétries, homothétie et simi¬ 
litude, transformations homographiques, inversion, 
involution). 

— Corrélation ; problèmes des tangentes et des 
enveloppes. 

— Problèmes de courbures. 

— Courbes du second ordre (coniques). 

— Surfaces du second ordre (quadriques). 
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L’œuvre mathématique de Newton est en étroite relation avec son œuvre de physicien, ou, comme on disait au XVII e siècle, de « philosophe naturel » et qui concerne l’optique et 
la mécanique. C’est en 1665-1666 qu’il élabora ses premières idées sur le calcul infinitésimal — qu’il nommait calcul des fluxions — ef sur la gravitation ; mais ses théories ne furent 
connues du grand public cultivé européen qu’à partir de 1687, année où furent publiés les fameux Principia, dans lesquels est énoncée la loi de la gravitation universelle. En 
physicien et astronome qu’il était, Newton se posa avant toutes choses le problème du mouvement d’un point matériel sur une trajectoire : que peut-on dire des éléments de ce 
mouvement (espace parcouru, vitesse, accélération) lorsque l’intervalle de temps At pendant lequel on l’étudie devient infiniment petit ? La réponse à cette question repose sur 
l’établissement de règles de calcul sur des grandeurs infiniment petites et elle débouche sur les applications importantes, telles la détermination de la vitesse et de l’accélération 
d’un mobile ou la construction des tangentes à une courbe. Ci-dessus : fragment d’un manuscrit de Newton sur la construction des tangentes à des courbes mécaniques (= courbes 

que l’on peut tracer à l’aide d’instruments autres que la règle et le compas). 


ANALYSE 


INTRODUCTION HISTORIQUE. Les précurseurs. 


L 'analyse est une discipline mathématique qui 
comprend plusieurs théories, dont les principales 
sont : 

— le calcul infinitésimal proprement dit (calcul 
différentiel et intégral) ; 

— la théorie des fonctions, et plus spécialement 
des fonctions d’une ou plusieurs variables réelles ou 
complexes ; 

— le calcul des variations d’une fonction d’une 
variable réelle ou complexe, la théorie des fonctions 
analytiques, etc. 

C’est une partie importante de l’édifice mathémati¬ 
que, née au XVII e siècle des découvertes de Cavalieri, 
Fermât, Pascal, Wallis, Newton et Leibniz. Elle a été 
développée au XVIII e siècle par Euler et Lagrange, et 
unifiée et généralisée au XIX e siècle par Cauchy, Abel, 
Jacobi, Riemann, Weierstrass et Cantor, puis, au 
XX e siècle, par Lebesgue, Borel, Volterra, Fréchet, etc. 
Ses applications à la physique ne se comptent plus. 


Naissance du calcul infinitésimal. 

Le calcul infinitésimal, c’est-à-dire le calcul sur les 
infiniment petits, est né à la fin du XVII e siècle. Toute¬ 
fois l’invention de Leibniz et de Newton a été précédée 
de nombreux tâtonnements dont ces deux grands 
savants ont su tirer les conséquences fécondes. Voici 
un bref panorama chronologique de cette invention. 


• Eudoxe et Archimède. Au IV e siècle av. J.-C., 
Eudoxe de Cnide inventa la méthode par exhaustion, 
qui consiste à diviser, par la pensée une surface ou un 
volume en une infinité de petits éléments et de consi¬ 
dérer la surface ou le volume en cause comme la 
somme à l’infini de ces éléments « infiniment petits ». 
Archimède se servit avec une grande élégance de cette 
méthode pour quarrer (= mesurer la surface) le cercle 
et la parabole, pour évaluer le volume des « corps 
ronds » (cylindre, cône, sphère). Ainsi, en divisant un 
segment de parabole en triangles de plus en plus petits 
dont les aires sont a, a/4, a/16, ..., on peut approcher 
l’aire du segment de parabole par la somme : 

* =a ( 1 + ; + i + -)' (1) 

avec autant de précision qu’on le veut. 

• La méthode par exhaustion est une décompo¬ 
sition d’une grandeur en éléments ; en grec, 
« décomposition » se dit analusis, d’où le français 
analyse. 

• François Viète, dont le rôle en algèbre a été 
signalé p. 10, a été l’un des premiers mathématiciens 
des temps modernes à calculer sur des séries infinies. 
En 1593, dans un ouvrage intitulé « Variorum de rebus 
mathematicis responsorum », il aborde le problème de 
la détermination du nombre jt — déjà approché par 
Archimède — en étudiant le rapport qui existe entre la 
surface d’un carré et celle d’un cercle dans lequel ce 
carré est inscrit. On démontre en géométrie que ce 
rapport est égal à 2 /jt et Viète a établi que ce nombre 
est la limite, à l’infini, du produit : 



Chaque terme f n de ce produit étant déduit du terme 
f n _., par la relation : 

= ’ • o) 

La relation (2) s’écrit aussi trigonométriquement : 

TT TT TT TT 

cos — x cos — x cos — x • • • x cos — X • • • (4) 

La formule (2) est le premier algorithme (= procédé 
systématique de calcul) infini connu. 

• Kepler, le grand astronome qui établit les lois 
du mouvement des planètes autour du Soleil, s’est 
posé lui aussi le problème du calcul de la longueur 
d’un arc de courbe quelconque, en l’assimilant à une 
ligne polygonale brisée dont le nombre de côtés tend 
vers l’infini ( Nova stereometria doliorum vinarium, 
1615). Il reprend, ce faisant, la méthode archimé- 
dienne, avec — il faut le dire — un peu trop de légèreté 
et beaucoup d’erreurs. 

• Cavalieri est un jésuite italien, disciple de 
Galilée et professeur de mathématiques à Bologne de 
1629 à 1647, date de sa mort. Il a établi le point de 
départ du calcul infinitésimal moderne dans un livre 
célèbre publié en 1635 : Geometria indivisibilium 
continuorum nova quadam ratione promota, titre 
qu’on résume habituellement en français par Géomé¬ 
trie des indivisibles. Sans entrer dans les détails de 
l’exposé de Cavalieri, il est intéressant d’en exposer les 
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résultats, dans le langage des mathématiques classi¬ 
ques. 

Le problème qui se pose est de « quarrer » une 
portion de courbe plane. Soit par exemple la parabole 
y = x 2 , et la corde AB, parallèle à l’axe des x, le point A 
ayant pour abscisse x = a et, par conséquent, pour 
ordonnée y = a 2 . L’aire du secteur ( AOB) est égale à 
l’aire du rectangle ABB' A' (voir figure ci-après) 
diminuée de l’aire des deux triangles mixtilignes 
hachurés sur la figure AOA' et BOB'. Pour calculer 
l’aire S du triangle AOA' par exemple, Cavalieri pro¬ 
pose de le diviser en une infinité de segments indivisi¬ 
bles dont l’aire infiniment petite serait notée dSdans 
notre notation moderne. L’aire S est alors la somme 
d’une infinité d’aires élémentaires dS, comprises entre 
les abscisses x = 0 et x = a, ce'qui s’écrit, en notation 
moderne : 


S = J‘ d S , (5) 

le signe / est un S (initiale de « somme ») allongé, et le 
membre de droite se lit : 

« intégrale définie de 0 à a de dS » . 

Ce qui importe, ici, c’est le résultat. Cavalieri a 
montré que la somme infinie avait pour limite : 

S =T- (6) 

d’où l’aire de la portion de parabole {AOB) : 

O o 3 A a 3 

Aire {AOB ) = 2 a 3 -— = —— (7) 

O ü 

(en effet l’aire du rectangle ABB' A' vaut 2 a 3 et le 
triangle mixtiligne BOB' a la même surface que le 
triangle AOA'). 



La parabole y = x 2 (pour que la figure soit plus 
nette, on a choisi des unités différentes pour les deux 
axes de coordonnées). Le point A a pour abscisse a, 
d'où A' A = a 2 ; l'aire du rectangle ABB' A' est égale à 
2 a x a 2 = 2 a 3 , et l’aire de chaque triangle mixtiligne 
coloré est égale à S = a 3 / 3. Donc l’aire du segment 
de parabole O AB est égale à 4 A 3 /3. 


Plus généralement, si, au lieu de la parabole y = x 2 , 
nous considérons la courbe y = x m {m : entier positif), 
l’aire S comprise entre la courbe, l’axe Ox et une 
ordonnée A' A, d’abscisse OA' = a, peut être calculée 
par une méthode analogue et on peut montrer qu’elle a 
pour valeur : 


Ce résultat a été démontré par Cavalieri en 1629 pour 
m = 1 et m = 2, par la suite, Cavalieri le démontra pour 
m = 3 et m = 4, et le généralisa — avec une rigueur très 
douteuse — pour tout m entier positif (c’est Fermât qui 
en donnera la première démonstration générale en 
1635) ; il s’exprime, en langage moderne, des deux 
manières équivalentes suivantes : 

1 - l’aire S est la primitive de la fonction y= x m 
qui s’annule pour x=0. 

2 - l’aire S est l’intégrale définie : 


ça a m+1 

/ x m dix = -— (9) 

Jo m +1 v ’ 

Premières applications et généralisations. 

Entre 1635 et 1684, les mathématiciens utilisent la 
« méthode des indivisibles » et les procédés de calcul 
sur des grandeurs infiniment petites pour résoudre des 
problèmes de géométrie : détermination de la tangente 
à une courbe en un point, rectification (calcul de la 
longueur) d’une courbe, calculs de surfaces et de 
volumes. 

• Fermât s’est penché sur les problèmes de 
minimums et de maximums, qui sont liés à la détermi¬ 
nation des tangentes. Sa méthode consiste à supposer 
que la grandeur A à calculer et qui est donnée par une 
équation de la forme f{A) = 0 peut être remplacée par 
A + E, l’équation f{A + E) = 0 étant valable. Il appelle 
cela adégaler f{A) et f{A+ E) (« adégaler » signifie 
« égaler approximativement »). On calcule donc 
f{A + E), on réduit les termes et, après avoir posé dans 
les derniers résultats E = 0, on obtient l’expression de 
A. En langage moderne, la méthode consiste à calculer 
sur A+ E, E étant un infiniment petit auquel on appli¬ 
que les règles du calcul ordinaire et qu’on annule 
ensuite. 

Fermât a maîtrisé cette « méthode des tangentes » 
dès 1632 (donc avant la publication du livre de Cava¬ 
lieri) ; on notera qu’elle est intimement liée à la géomé¬ 
trie analytique naissante. Descartes a été conduit, à la 
même époque (vers 1636) à se poser le problème de la 
construction des normales aux courbes géométriques, 
problème qu’il résout par l’algèbre. On retrouve des 
préoccupations analogues chez Roberval, puis, à la 
génération suivante, chez l’Anglais Isaac Barrow, qui 
fut le maître de Newton. 

• Pascal, dans son Traité des sinus et du quart 
de cercle, est amené à considérer — dans le cadre d’un 
théorème de trigonométrie — ce qu’on nomme le 
triangle caractéristique (voir figure) : ce triangle rec¬ 
tangle, dont l’hypoténuse EE' est portée par la tan¬ 
gente en D à une courbe C, peut devenir aussi petit que 
l’on veut quand E et E' tendent vers D tout en 
restant constamment semblable à un triangle fixe AID. 
Le rapport des côtés de l’angle droit reste donc 
constant quand le triangle devient infiniment petit. 



Le triangle caractéristique de Pascal (en bleu) 
associé au quart de cercle. 


• John Wallis a sans doute été le mathématicien 
anglais le plus important avant l’avènement de Newton. 
Homme d’église, il aborda les mathématiques assez 
tardivement, en 1647 (il avait alors trente et un ans), par 
la lecture de la Clavis mathematicae (« Clé pour les 
mathématiques», 1631) du mathématicien et théolo¬ 
gien William Ougthred, ouvrage assez traditionnel pour 
l’époque, et qui traitait de notation, des logarithmes, 
des fractions décimales et de trigonométrie. L’œuvre 
principale de Wallis est YArithmetica infinitorum 
(«Arithmétique des Infinis»), publiée en 1655 et qui 
porte sur la méthode des indivisibles de Cavalieri telle 
que le physicien italien Torricelli l’avait interprétée ; à 
titre d’anecdote, signalons qu’on lui doit d’avoir intro¬ 
duit le symbole « oo » pour désigner l’infini. 

Wallis a été, avant tout, un calculateur et un algé- 
briste, qui a cherché à résoudre certains problèmes de 
quadratures par des approximations numériques illimi¬ 
tées, et non plus par des divisions géométriques à 
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l’infini. Il a notamment établi le célèbre produit infini 
qui permet de calculer le rapport 4/tt avec toute la 
précision désirée : 

4 3x3x5x5x7x7x9x9x11 xll x ••• 

tt 2 x 4 x 4 x 6 x 6 x 8 x 8 x 10 x 10 x ••• 

( 10 ) 

• Les suites convergentes. C’est dans l’esprit de 
ces approximations illimitées que se place l’introduc¬ 
tion des séries convergentes dont il sera question plus 
loin (voir p. 119). La notion et l’expression apparais¬ 
sent en 1667 dans l’œuvre de l’astronome écossais 
James Gregory, Vera circuli et hyperbolae quadratura 
(« Véritable quadrature du cercle et de l’hyperbole »). 
Chez cet auteur, il s’agit de calculer l’aire d’un secteur 
circulaire à l’aide d’une suite de valeurs de cette aire 
par excès et par défaut. L’Allemand Nicolaus Kauf¬ 
mann, dit Mercator, a publié une méthode de dévelop¬ 
pement d’une fonction en série en 1668; il a notam¬ 
ment montré que la fonction In x (voir p. 115) pouvait 
être calculée par la somme infinie 

x 2 x 3 x 4 x 2 "- 1 x 2n 

* _ T + ~3 4 + '” + 2n -1 ~Yn + " 

dont les termes sont successivement positifs et néga¬ 
tifs. Cette méthode de représentation d’une fonction de 
x par un développement en série sera perfectionnée 
par Newton, MacLaurin et Taylor : elle est à l’orée du 
calcul différentiel et intégral. 

• Christiaan Huygens est le dernier grand pré¬ 
curseur de Newton et de Leibniz. Il a été conduit par 
ses recherches techniques sur le réglage des horloges 
à déterminer la trajectoire de l’extrémité pesante d’un 
pendule simple pour que le pendule soit rigoureuse¬ 
ment isochrone, c’est-à-dire d’une régularité parfaite. 
L’étude mathématique du problème aboutit au calcul, 
par la méthode des indivisibles améliorée, de l’inté¬ 
grale définie 


Ch d z 
Jo Vz {h — z ) ’ 

h désignant la hauteur maximale du point pesant par 
rapport à la position d’équilibre et z son altitude à 
l’instant t quelconque par rapport à cette position. La 
trajectoire correspondante est une courbe qu’on appe¬ 
lait au XVII e siècle roulette (Pascal), et que les mathé¬ 
maticiens nomment maintenant cycloïde. Elle fit l’objet 
d’un défi célèbre lancé aux savants de l’époque, par 
Pascal, en 1658. L’un des points les plus importants du 
défi concernait la rectification (calcul de la longueur 
d’un arc) et la quadrature de la cycloïde. 

• Les logarithmes. Il n’est pas inutile de parler 
ici de l’invention des logarithmes, qui remonte aux 
premières années du XVII e siècle et dont les consé¬ 
quences pour l’analyse ont été très importantes. Le 
précurseur en la matière fut un horloger suisse du nom 
de Joost Bürgi, vers 1603. Celui-ci fut l’assistant, à 
Prague, des astronomes Tycho Brahé et Kepler, pour 
lequel il construisit des horloges d’une précision 
remarquable pour l’époque. C’est grâce à la qualité de 
ces instruments que Kepler put établir sa théorie du 
système solaire, résumée par les fameuses lois qui 
portent son nom. 

Comme tous ceux qui travaillaient sur des observa¬ 
tions astronomiques, Bürgi avait besoin de calculer sur 
des grandeurs trigonométriques (sinus, cosinus, etc. 
d’un angle). Les astronomes se servaient alors de 
tables trigonométriques, dont les plus remarquables 
avaient été publiées par Viète en 1579. C’est pour 
simplifier les calculs trigonométriques que Bürgi 
inventa ce qu’on devait appeler ultérieurement des 
logarithmes. Toutefois son invention ne fut pas 
connue, et c’est à un baron écossais, grand proprié¬ 
taire terrien et amateur éclairé, que revient, finalement, 
la gloire d’avoir créé ces « nombres artificiels », 
comme on les nommait alors, et qu’il baptisa loga¬ 
rithmes : John Napier, baron de Merchiston, connu 
sous le nom de Neper, qui publia en 1614 sa Mirifici 
logarithmorum canonis descriptio (« Description de la 
règle merveilleuse des logarithmes »). 

Pour Neper, un logarithme est uniquement le loga¬ 
rithme du sinus d’un angle, tel que, notamment, sin 90° 
ait pour logarithme 0. A partir d’une définition géomé¬ 
trique simple, combinée à des considérations arithmé¬ 
tiques, Neper a ainsi établi une table des logarithmes 
des sinus d’un angle ; l’intérêt du système est alors lié à 
une relation célèbre qui dit que le logarithme d’un 
produit est la somme des logarithmes des termes de ce 
produit, ce qui permet de simplifier grandement les 
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Jacques Bernoulli (1654-1705). 


En généralisant la méthode, on montre que x = t n 
admet pour fluxion x = nt n \ ainsi que les formules 
bien connues de dérivation (voir p. 113). 

• Application au calcul de l’aire d’une courbe. 
Reprenons le cas de la parabole, étudiée p. 103. L’aire 
. S que nous avons à calculer (voir figure) est une 
I fonction de x; on montre que cette aire a pour fluxion 
x 2 (c’est-à-dire a 2 dans le cas de figure). Le problème 
| est donc de trouver la fluente de x 2 qui s’annule pour 
^ x = 0 ; cette fluente est égale à : 

§ x 3 

* s = %-. (16) 

O O 

(en effet la fluxion 5 de S est égale à 3 x 2 /3 = x 2 ). 

.O 

O 

~ Leibniz et le calcul des différences. 

gi Leibniz est arrivé aux mêmes résultats que Newton 
^ en 1672 et il les a publiés dès 1684 ( Nova methodus pro 
g maximis et mini mis). Il a abordé le problème de la 
^ détermination des tangentes en considérant le triangle 
| caractéristique de Pascal, défini plus haut (p. 103). 

1 Leibniz a introduit un système de notation plus clair 
a.que celui de Newton, en appelant dx le « moment », 
| c’est-à-dire l’accroissement infiniment petit, de la gran¬ 
di deur x, moment qu’il nomme une différence. Il définit 
5 aussi la différence de la différence ou différence 

* seconde ddx (ou d 2 x) ; etc. Enfin il note la sommation 

2 à l’infini de grandeurs infiniment petites à l’aide du 
^ symbole /. 

•I Soit donc y = f{x) une fonction de x ; un accroisse- 
ment infiniment petit dx de la variable entraîne un 
| accroissement infiniment petit dy de la fonction. La 
valeur limite du quotient dy/dx est la dérivée de la 
fonction y, c’est-à-dire ce que Newton appelait la 
fluxion y de cette fonction. La « différence » dy a donc 
pour valeur : 


calculs numériques. La notion fut simplifiée et généra¬ 
lisée par Henry Briggs (1617), qui introduisit le concept 
de logarithme décimal d’un nombre (et non plus 
uniquement d’un sinus). La notion de logarithme népé¬ 
rien n’est pas de Neper ; elle a été introduite par 
S. Lacroix vers 1800. 

Newton et le calcul des fluxions. 

Les premières découvertes de Newton concernant le 
calcul infinitésimal datent de 1665 ; mais elles n’ont été 
rendues publiques que tardivement, dans les ouvrages 
suivants : 


d y = ^j d x, (17) 

soit, avec la notation moderne due à Lagrange : 

dy = y' dx. (18) 

Comme on le verra plus loin (p. 113) ces définitions 
manquent encore de rigueur (il y manque notamment 
la théorie des limites). Quoi qu’il en soit, l’outil 
infinitésimal est créé : il ne reste plus qu’à s’en servir 
pour étudier les fonctions et les relations entre les 
fonctions, objet principal de l’analyse. 


— 1687 - Philosophiae naturalis principia 

mathematica (Principes mathématiques de la philoso¬ 
phie naturelle), le chef-d’œuvre newtonien, où est 
exposée la loi de la gravitation ; 

— 1704 - Tractactus de quadratura curvarum 
( Traité de la quadrature des courbes), écrit en 1676 et 
publié en appendice à son traité d’optique ; 

— 1711 - De analysis per aequationes numéro 
terminorum infinitas , écrit en 1689 ; 

— 1736 - Method of fluxions and infinité sériés 
( Méthode des fluxions et séries infinies), écrit en latin 
en 1671 et publié dans une traduction anglaise après la 
mort de Newton. 

• Fluxion et fluente. Soit x une grandeur qui 
dépend d’une variable t (Newton est préoccupé par 
des problèmes de mécanique, dans lesquels la variable 
est le temps t). Appelons moment de x ou de t un 
accroissement infiniment petit de ces grandeurs, et 
notons : 

moment de t = 0 

moment de x = *0 ; ' 1 ' ' 

la grandeur x est appelée fluxion de x, et x est la 
fluente de x. Dans notre langage actuel, * est la 
dérivée de la fonction x, et x la primitive de la fonction 
x. 

• La méthode de calcul est la suivante. Soit par 
exemple x = 3 t ; calculons sa fluxion x. 

1 - Donnons à t l’accroissement 0 ; il en résulte 
pour x l’accroissement xO et l’on peut écrire : 

x+*0 = 3(f + 0). (12) 

2 - On tire de (12) : 

*0 = 3(f + 0)-x (13) 

mais, comme x = 3 t, il vient : 

xO = 3.0 , (14) 

0 désignant une variation infiniment petite de t. 

3 - En divisant les deux membres de gauche par 
l’infiniment petit 0, il vient : 

x = 3 , (15) 

qui est la fluxion cherchée. 


De Leibniz à Euier et Lagrange. 

Les continuateurs immédiats de Leibniz et de Newton. 

Entre 1690 et 1770 environ, les premiers disciples de 
Leibniz et de Newton ont principalement étudié les 
séries convergentes, le calcul des infiniment petits 
conduisant à des calculs sur les séries. En particulier 
ils fournissent des méthodes pour développer le? 
fonctions sous la forme d’une somme de termes 
constituant une série convergente. 

Sur le continent (principalement à Paris et en Suisse) 
les propagateurs des théories de Leibniz furent Guil¬ 
laume de L’Hospital, auteur d’un traité d’ensemble sur 
l 'Analyse des infiniment petits (1696), Jean et Jacques 
Bernoulli (ce dernier professeur à Bâle), Varignon, 
Saurin, Riccati, Fagnano, etc. L’algébriste Michel Rolle 
se rallia à la nouvelle théorie dans les dernières années 
du XVII e siècle. Les oroblèmes abordés à l’aide du 
calcul infinitésimal par ces savants concernent princi¬ 
palement la géométrie infinitésimale. 

En Grande-Bretagne, à côté des auteurs de traités 
sur le calcul newtonien, on doit citer les noms des 
mathématiciens qui ont étudié les développements des 
fonctions en séries : Brook Taylor (1715), Stirling (qui 
établit la série dite « de MacLaurin » en 1717 ; MacLau- 
rin la retrouvera en 1742), Abraham de Moivre. Le 
Traité des fluxions (1742) de MacLaurin clôt cette 
période. 

Euler et l'analyse au XVIII e siècle. 

Les derniers disciples de Leibniz et de Newton 
s’éteignent dans les années 1740 (Jean Bernoulli meurt 
en 1748, MacLaurin en 1746). Il va leur succéder deux 
grandes générations d’analystes : la première est 
représentée par Daniel Bernoulli (fils de Jean Ber¬ 
noulli), Euler, Clairaut et D’Alembert ; la seconde par 
Lagrange, Monge, Laplace et Le Gendre, celui-ci fai¬ 
sant le lien avec les mathématiciens du XIX e (il est mort 
en 1833). Ce sont les travaux d’Euler (Institutions du 
calcul différentiel, 1755, Institutions du calcul intégral, 
1768-1770, tous deux en latin) et de Lagrange (Théorie 
des fonctions analytiques, 1797 ; Traité de la résolution 


des équations numériques, 1798 ; Leçons sur le calcul 
des fonctions, 1799), qui dominent cette période, au 
cours de laquelle se développe la théorie des fonctions 
qui utilise toutes les ressources du calcul infinitésimal, 
et la théorie des équations différentielles (déterminer 
une fonction y lorsqu’on donne une relation entre 
cette fonction et ses dérivées successives). Voici quel¬ 
ques points de repère chronologiques. 


Dates Evénements 


1718 

Première définition (après Leibniz) de la 

* 

notion de fonction par Jean Bernoulli (voir 

P- 20). 

1724 

Riccati résout l’équation différentielle qui 
porte son nom, de la forme : 

y' = P(x) + yQ(x) + y 2 R(x). 

1728 

Euler commence à se poser le problème du 
calcul des variations 81 d’une intégrale /, en 
rapport avec ce qu’on nomme des « problèmes 
d’extremum S ». De ces travaux naîtra, en 1744, 
un traité d’ensemble sur le Calcul des varia¬ 
tions, nouvelle branche de l’analyse. 

1734 

Euler introduit les équations aux dérivées 
partielles. 

1747 

D’Alembert étudie l’équation aux dérivées 
partielles des cordes vibrantes : 

a 2 u 2 a 2 u 

a t 2 ~ a ax 2 

1748 

Euler : étude systématique des fonctions élé¬ 
mentaires, classées en algébriques et transcen¬ 
dantes, dans l’ Introduction à l’analyse des 
infinis. 

1749 

Généralisation de la notion de fonction par 
Euler (voir p. 20). 

1750 

Euler : résolution des équations différentielles 
linéaires à coefficients constants. 

Fagnano : publie ses recherches (entreprises 
à partir de 1716) sur la rectification (= calcul de 
la longueur des arcs) de l’ellipse et de l’hyper¬ 
bole. 

1756 

Reprise du problème de la rectification de 
l’ellipse et de l’hyperbole par Euler ; la solution 
conduit à calculer des intégrales contenant la 
racine carrée d’un polynôme du 3 e ou du 

4 e degré, et qu’on nomme des intégrales ellipti¬ 
ques (elles furent dénommées ainsi par Le Gen¬ 
dre). Le problème du calcul des intégrales ellipti¬ 
ques devant être résolu au XIX e siècle seulement, 
par Abel. 

1762 

Lagrange : Mémoire sur le calcul des varia¬ 
tions ; Lagrange perfectionne le symbolisme, 
généralise la méthode d’Euler, et applique le 
nouveau calcul à des problèmes de mécanique et 
de minimums. 

1767 

D’Alembert développe la théorie des limites, 
base de l’analyse. 

1772 

Lagrange : théorie des fonctions, fondée sur 
l’emploi des développements en série (ses 
travaux seront présentés d’une façon systémati¬ 
que dans les traités de 1797 et 1799, déjà cités). 
Lagrange introduit la notation y'= f(x) pour 
désigner la dérivée de la fonction y = f(x). 

1783 

Le Gendre : introduction, dans le calcul de 
l’attraction oar un point extérieur, des coeffi- 
cients du développement de Vl - 2 ax + x 2 
selon les puissances croissantes de a (polynô¬ 
mes de Le Gendre). 

Clairaut : définition de la fonction potentiel V. 

1785 

Laplace montre que la fonction V(x, y, z) est 
solution de l’équation aux dérivées partielles : 

a 2 V d 2 V a 2 v _ 

- 2+ -2 + - 2 = 0 . 

ax ay az 

1786-1793 

Travaux de Le Gendre sur les intégrales ellipti¬ 
ques (classification, réduction aux formes cano¬ 
niques, approximations). 

1788 

Lagrange : Mécanique analytique. 

1797-1799 

Publication des grands traités d’algèbre et 
d’analyse de Lagrange. 


L'analyse au XIX e siècle. 

Le XIX e siècle est marqué, dans le domaine de 
l’analyse, par les idées fulgurantes de Gauss, la grande 
et rigoureuse synthèse de Cauchy, les applications 
multiples de l’analyse à la physique théorique, la 
solution des problèmes en suspens concernant les 
séries et les intégrales elliptiques (Le Gendre, Jacobi, 
Abel), le large développement de la théorie des fonc- 
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tions d’une variable complexe et des fonctions analyti¬ 
ques, la généralisation de cette théorie par Riemann et 
Weierstrass, qui abordent systématiquement le pro¬ 
blème des discontinuités, et la création de la théorie 
des ensembles par Cantor. 

Une chronologie, même succincte des travaux 
innombrables des mathématiciens du XIX e siècle dans 
le domaine de l’analyse exigerait plusieurs pages de ce 
volume. Nous nous bornerons donc à classer certains 
problèmes fondamentaux. 

Théorie des fonctions et séries. 

• Cauchy , dont l’œuvre s’étend sur la première 
moitié du XIX e siècle (il est mort en 1857) a donné une 
nouvelle définition de la continuité des fonctions, qui 
reste encore à la base de la théorie des fonctions 
(1821), et il a été l’un des fondateurs de la théorie des 
fonctions d’une variable complexe (1821-1825), avec 
Gauss, qui s’intéressait au problème depuis 1799. 

• Les fonctions elliptiques sont des fonctions 
rationnelles de deux variables dépendantes x et y, où 
y est la racine carrée d’un polynôme en x du 3 e ou du 
4 e degré ; elles interviennent, comme on l’a dit p. 104, 
dans le calcul des arcs d’ellipse ( rectification de 
l’ellipse ), d’où leur nom. Le Gendre y consacra la 
majeure partie de ses travaux, de 1785 jusqu’à 1832, 
époque à laquelle il publie un gros traité en trois 
volumes sur la question, sans l’avoir vraiment résolue. 

En fait, le problème du calcul des intégrales ellipti¬ 
ques exigeait d’être abordé d’une manière non classi¬ 
que, c’est-à-dire non « legendrienne ». Cette méthode, 
Gauss l’avait découverte dès 1798, mais, fidèle à une 
attitude ésotérique qu’il conserva jusqu’à sa mort, il ne 
l’avait pas fait connaître à ses contemporains. De sorte 
que la solution de ce grand problème d’analyse ne fut 
obtenue qu’en 1828 et 1829, par Jacobi et par le jeune 
Abel, dont la petite histoire retiendra la précocité (il est 
mort à 27 ans, trois ans avant Galois). Abel a montré 
que les intégrales elliptiques étaient un cas particu¬ 
lier d’intégrales plus générales appelées inté¬ 
grales abéliennes, et qu’on pouvait les résoudre sim¬ 
plement en pratiquant une transformation appelée 
inversion d’une fonction. Jacobi prolongea les travaux 
d’Abel en décrivant les quatre fonctions elliptiques 
fondamentales, exprimées à l’aide de fonctions expo¬ 
nentielles appelées les fonctions 0 , qui jouent aussi un 
rôle très important en théorie des nombres. 


Sir Isaac Newton (1642-1727) : il fut l’un des plus 
illustres hommes de science de tous les temps. Ses 
découvertes les plus importantes concernent 
l’invention du calcul différentiel et intégral, la théo¬ 
rie de la gravitation universelle et la théorie de la 
lumière blanche. 



• Dans la deuxième partie du XIX e siècle, la 
théorie des fonctions s’élargit considérablement, à 
partir, notamment, des résultats obtenus par Abel. 

— Dès 1844, Hermite transforme la théorie des 
fonctions elliptiques, en les rattachant non pas aux 
intégrales de Le Gendre mais à la fonction 6 dont il 
vient d’être question. Il découvre ainsi une fonction 
invariante quand on change la variable x en : 

x ' = ax + b , (ab' — ba' = 1), (1) 

a'x + b' g 

a, b, a' et b' étant des entiers, changement qui se | 
nomme transformation homographique. Cette fonction J 
a été appelée fonction modulaire, et son étude est £ 
reliée à la théorie des groupes. Deux fonctions modu- 
laires particulières ont eu un succès considérable en t> 
analyse : les fonctions kleinéennes, étudiées par | 
F. Klein, et les fonctions 0-fuchsiennes (du nom du £ 
mathématicien allemand L. Fuchs), étudiées par Poin- > 
caré en 1881. | 

L’étude des fonctions abéliennes (à plusieurs varia-J 
blés complexes) est développée par Jacobi, Gôpel.ÏÏ 
Hermite, Riemann, Weierstrass, Clebsch et Gordan.© 
Leur théorie peut être considérée comme achevée en g 
1866, lorsque Clebsch et Gordan les rattachent à la 
géométrie des courbes algébriques. Toutefois, Weier- | 
strass devait en proposer un exposé beaucoup plus J 
général et beaucoup plus simple vers 1880. 

— Jusqu’à 1851, la théorie des fonctions est | 
dominée par le point de vue de Cauchy, donnant le | 
primat à l’idée de continuité, tant pour les fonctions de J 
variables réelles que pour les fonctions de variables 
complexes. En 1851, Riemann soutient une thèse J 
célèbre ( Fondements d’une théorie générale des fonc 
tions d’une variable complexe), et reprenant le point de £ 
vue exprimé par Gauss une douzaine d’années aupara- 
vant, il établit une relation entre l’étude de la fonction | 
f{z) = u + i v, avec z = x + iy, et l’équation différentielle § 
u"(x) + u"(y ) = 0, qui n’est autre que l’équation d’une § 
fonction potentiel. | 

La méthode de Riemann est plus générale que celle | 
de Cauchy et repose sur des considérations dites ^ 
topologiques qui seront expliquées ultérieurement. 
Elle a fait de nombreux adeptes chez les 
« topologistes » (Neumann, Gordan, Hankel, Clebsch, 
Fuchs, C. Jordan, Enrico Betti et Poincaré). 

— La théorie des séries — qui fait suite aux 
travaux de l’École britannique du XVIII e siècle — a été 
élaborée par Cauchy (séries entières, 1821), Dirichlet 
(notion de convergence uniforme, en 1840) et Abel 
(1826). Toutefois, et cela jusqu’à la fin du XIX e siècle, 
les mathématiciens se sont méfiés des séries divergen¬ 
tes, qualifiées de « diaboliques » par Abel. Les mathé¬ 
maticiens se sont surtout préoccupés de définir des 
critères de convergence : Cauchy (1812), Joseph Ber¬ 
trand (1842), O. Bonnet (1843), du Bois-Reymond 
(1873), Dirichlet, Dedekind, Kronecker, Weierstrass. On 
isolera les travaux de J. Fourier (entre 1807 et 1822) sur 
les séries trigonométriques, dites séries de Fourier. 

Calcul différentiel et intégral. 

• La notion d’intégrale définie a été définie par 
Cauchy en 1823, par référence aux deux notions de 
continuité d’une fonction entre deux valeurs a et b de 

jù la variable et de limite. 

? Elle fut généralisée par Riemann (1854), qui introdui- 
^ sit en analyse ce qu’on nomme « l’intégrale au sens de 
§ Riemann » (notion reprise par Darboux en 1875). Deux 
^autres généralisations furent données en 1894, par 
^Stieltjes, et en 1902 par Lebesgue (« intégrale au sens 
© de Lebesgue »). 

§ • La résolution des équations différentielles (et 

«s des équations aux dérivées partielles dans le cas de 
I fonctions à plusieurs variables) est un problème très 
>3 vaste et dont la solution est indispensable aux progrès 
^rde la physique théorique, qui se construit dans le 
| courant du XIX e siècle. 

o Diverses méthodes générales ont été proposées, en 
-particulier: la méthode des approximations successi- 
| ves (Fuchs, Peano, É. Picard, etc. entre 1870 et 1900) ; 

^ la méthode dite des « fonctions majorantes » (c’est le 
1 « calcul des limites » exposé par Cauchy en 1831, et 
| reprise ultérieurement par Weierstrass, Darboux, 
£É. Picard, Poincaré, etc.); la méthode de la variation 
g des constantes (Cauchy, 1840 ; Poincaré). 

£ Enfin, tous les analystes du XIX e siècle ont élaboré 
js des méthodes d’intégration, générales ou particulières, 
Idont le détail ne peut être donné ici. 

* 

b La théorie des ensembles. 

.ts Cette théorie coiffe à la fois la théorie des nombres, 

| l’algèbre, la géométrie et l’analyse. Son histoire est 
£ résumée p. 13. 



Gottfried Wilhelm Leibniz (1646-1716) : philoso¬ 
phe, historien, mathématicien, astronome, physi¬ 
cien, Leibniz est l’incarnation moderne de l’idéal 
encyclopédique de la Renaissance. Il fait partie de 
cette lignée de grands penseurs à qui la civilisation 
occidentale doit d’être ce qu’elle a été, de Platon et 
Aristote à Hegel et Einstein. 


L'analyse au XX e siècle. 

Théorie des fonctions. 

• Fonctions de variables réelles. Leur théorie a 
été modifiée par l’apport de la théorie des ensembles. A 
l’époque de Cauchy (ou même de Riemann), on étu¬ 
diait les variations d’une fonction sur un intervalle 
[a, b ] ; en appelant point un nombre réel, on définis¬ 
sait le voisinage d’un point x, comme un intervalle. 
Après les travaux de Dedekind et Cantor, on étudie une 
fonction sur un ensemble quelconque de points, et le 
voisinage d’un point devient un point de cet ensemble. 
La perspective n’est plus la même et de nouveaux 
concepts, de nouvelles classifications s’imposent, d’où 
les théories de Baire sur les fonctions continues et 
discontinues (1899-1905) et de Lebesgue (1902) sur la 
notion de fonction mesurable en rapport avec une 
généralisation de la notion d’intégrale. 

D’autres problèmes sont soulevés : sommation des 
séries divergentes (Cesarô), introduction des fonc¬ 
tions quasi analytiques (Borel, 1912), étude des séries 
trigonométriques et des ensembles analytiques (Luzin, 
1930), introduction des fonctions presque périodiques 
(H. Bohr, 1922 ; H. Weyl ; K. Schwarz ; etc.). 

• Fonctions de variables complexes. La classifi¬ 
cation de ces fonctions par les analystes du XIX e siècle 
laisse à désirer ; elle a été reprise avec plus de rigueur 
par É. Borel, P. Montel, Goursat, Men’èov, etc. (fonc¬ 
tions monogènes, analytiques, holomorphes, etc.). La 
théorie des fonctions entières a été entreprise et 
complétée par Poincaré, Hadamard, É. Borel, Valiron, 
et synthétisée par R. Nevanlinna, et l’étude des familles 
normales de fonctions a été menée par des mathémati¬ 
ciens de toutes Écoles durant la première moitié du 
XX e siècle. 

Il serait vain, ici, de proposer des listes de noms et de 
dates qui n’évoqueraient pas grand-chose chez la 
plupart de nos lecteurs. L’idée générale à retenir est 
que, de 1902 à 1970 environ, les fonctions des variables 
complexes ont été approfondies, classées en familles, 
structurées, grâce à une multitude de travaux de la 
communauté des mathématiciens. 
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STRUCTURES FONDAMENTALES DE L'ANALYSE 



Leonhard Euler (1707-1783). Ce grand mathémati¬ 
cien helvétique a été le maître à penser des mathé¬ 
maticiens du XVIII e siècle. Son œuvre, à peu près 
uniquement consacrée à l’analyse (calcul infinitési¬ 
mal, théorie des fonctions), est capitale. 


Équations différentielles. 

Elles ont bénéficié de la théorie des groupes (Picard, 
1883 ; J. Drach, 1893 ; J. F. Ritt, 1950). Les équations 
aux dérivées partielles ont été traitées analytiquement 
par Élie Cartan (1901), Janet (1913), Vessiot (1924), etc. 
Ici aussi, les travaux sont devenus rapidement innom¬ 
brables, et leur présentation synthétique est impossible 
dans le cadre de cet ouvrage. 

Signalons simplement l’apport de la topologie dans 
ce domaine (Leroy, Schauder, 1933), des théories 
probabilistes, de l’analyse fonctionnelle, etc. 


lesquelles aucune explication n’est possible. Nous 
aborderons par la suite, un par un, les domaines les 
plus importants de l’analyse (théorie des fonctions 
d’une variable réelle, d’une variable complexe, de 
plusieurs variables, calcul différentiel et intégral, etc.). 


Structures des ensembles 
de l'analyse. 

Les objets de l'analyse. 

L’analyse mathématique étudie divers objets qui se 
nomment : nombres réels, nombres complexes ou 
hypercomplexes, fonctions, opérations sur les nom¬ 
bres et les fonctions, etc. Ces objets constituent des 
ensembles et, si l’on définit sur ces ensembles certai¬ 
nes lois de composition, nous pouvons parler de leur 
structure (voir p. 37). 

Lorsque les mathématiciens ont inventé ou décou¬ 
vert les objets de l’analyse, ils ne les ont pas d’abord 
considérés comme appartenant à un ensemble muni 
d’une structure déterminée, pour la bonne raison que 
cette notion est très récente (elle a quelque 100 ans 
d’âge, alors que l’analyse a environ 300 ans). Ils ont 
donc défini ces objets et les opérations sur ces objets 
avec plus ou moins de rigueur, et cela leur a parfois 
joué des tours pendables (voir, par exemple, nos 
remarques sur les séries, p. 52), car telle formule, telle 
loi, valable pour certains objets dans certaines condi¬ 
tions et qui semble « aller de soi », peut devenir 
fausse lorsque les conditions changent. 

Depuis un siècle environ — un peu moins peut-être 
— on a pris l’habitude en mathématiques de définir les 
objets d’une théorie à l’aide d’ axiomes indépendants, 
compatibles, et en nombre aussi restreint que possible. 
Ce faisant, on prend une assurance contre toutes les 
conséquences absurdes (donc fausses) des notions ou 
des opérations mal définies. 

Structures fondamentales de l'analyse. 

La plupart des ensembles dont nous aurons à traiter 
ont une structure d’espace vectoriel sur un corps K. Si 
cette expression vous semble mystérieuse, reportez- 
vous à la p. 46 où elle est expliquée. En bref, cela 
signifie que les éléments d’un ensemble E sont eux- 
mêmes des ensembles de 1, 2, 3, ... n éléments d’un 
corps K\ nous nommerons les éléments appartenant à 
E des points ou des vecteurs (ne pas confondre le 
sens général de ce terme avec le sens particulier 
qu’on lui donne en géométrie élémentaire) et les 
éléments appartenant à K des scalaires. Un élément x 
de E s’écrira : 

x=(a), 

*=(«. 0 ), 

X = (a, fi, y ), 

X = {a, p, y, 8), 


Généralisation de l'analyse. 


(1) 


X = {a i, a 2 , ..., a n ) , 


— Il est important de définir la notion d’espace 
borné. Nous allons utiliser les définitions fondamenta¬ 
les sur les relations d’ordre (p. 17). 

1 - Un ensemble A (Z E est dit borné si, pour 
tout x E E et quel que soit y G A, la distance D(x, y) 
est majorée par une constante fixe. Il est dit non borné 
si, pour tout nombre réel C, il existe dans A deux 
points x, y, tels que D(x, y) > C. Si A = E, l’espace E 
est dit lui-même borné ou non borné. 

2 - On appelle boule ouverte l’ensemble des 
points x E E tels que D(x, x 0 ) < r ; x 0 est le centre de 
la boule. Si l’on a D(x, x 0 )«$ r, la boule est dite fermée. 

3 - Toute boule de centre x 0 est dite voisinage 
du point x 0 . 

— Ces définitions nous permettront de définir 
une suite convergente et sont à la base de la théorie 
des limites, étudiées ci-après, au paragraphe C. Nous 
verrons aussi que divers ensembles de fonctions peu¬ 
vent être munis d’une métrique D et constituer, par 
conséquent, des espaces métriques. 

• Espace vectoriel normé. Comme on l’a dit, 
c’est un espace vectoriel doté d’une métrique. Prenons 
le cas très simple (et très important) des nombres réels. 
Ils forment un corps IR, mais on peut aussi les considé¬ 
rer comme un espace vectoriel sur IR, chaque nombre 
étant un vecteur à une composante. 

Pour définir une métrique dans IR, choisissons un 
point fixe O, et associons à chaque x G (R sa distance 
au point O, notée Ixl, satisfaisant aux conditions 
suivantes : 

1 - Si x^0, I x I > 0 ; 10 1 = 0. 

2 - Pour tout A E IR, | Ax I = I A I I x I. (3) 

3-|x + y|ss|x| + |yl. 

I x I est appelé norme du vecteur point x. Si l’on 
définit la distance entre deux points x et y par 
D(x, Y) = I x - y I, on constatera que (3) est bien équi¬ 
valent à (2), c’est-à-dire qu’un espace vectoriel normé 
est métrique : on peut donc y mesurer la distance entre 
deux de ses points et se servir de la méthode appelée 
« passage à la limite ». Un espace vectoriel normé qui 
respecte en outre le critère de Cauchy (voir ci-après, 
p. 107) est dit complet ; on l’appelle aussi espace de 
Banach. 


Suites convergentes. 

Définition. 

Considérons les points x 1f x 2 , ..., x n , ... d’un espace 
métrique E ; ils constituent ce qu’on nomme une suite, 
qu’on peut écrire { x n }, les accolades soulignant qu’il 
s’agit d’un ensemble de points de cet espace, ou x n s’il 
n’y a pas d’ambiguïté. 

Soit maintenant un point x de l’espace considéré et 
étudions la distance D(x, x n ) d’un point x n à x, 
c’est-à-dire le nombre D(x, x n ). Si, pour tout nombre 
e > 0 (et donc aussi petit que l’on veut), on peut trouver 
un nombre entier N, tel que, pour tout n s* N, on a : 


• L’analyse fonctionnelle a pour origine les 
travaux de Volterra, vers 1900. Elle se propose pour but 
l’étude d’une fonction d’une infinité de variables. Cette 
infinité de variables peut être représentée par les 
points d’une ligne courbe (« fonctions de lignes »), ou 
par les valeurs prises par une fonction d’un nombre fini 
de variables («fonctions fonctionnelles»). En 1915, 
M. Fréchet a élargi le domaine de l’analyse fonction¬ 
nelle en l’étendant à un ensemble de variables abstrai¬ 
tes (non nécessairement numériques). 

• L’analyse générale a pour objet l’étude des 
transformations d’éléments y de nature quelconque 
(pas nécessairement numérique) en éléments quelcon¬ 
ques, transformations notées par la fonction Y= f(y). 
Cette théorie généralise les concepts classiques (conti¬ 
nuité, différentiation, etc...) et en particulier le concept 
de limite, qui devient, ici, le concept de contiguïté. On 
rejoint alors les préoccupations de la topologie géné¬ 
rale (voir p. 127). 


selon qu’il appartient à un espace vectoriel à une, 
deux, trois, quatre, ..., n dimensions. Les scalaires tels 
que a sont les composantes du vecteur x (on dit aussi 
ses coordonnées). Ajoutons enfin que les scalaires a, 
p, ... peuvent être des « n’importe quoi », du moment 
qu’on peut les combiner selon les axiomes de la 
structure de corps, énoncé p. 43 ; ici, nous suppose¬ 
rons toujours que ces scalaires sont des nombres, 
réels ou complexes (le corps U des réels et le corps C 
des complexes sont décrits pp. 53-57). 

Si nous définissons axiomatiquement des propriétés 
ou des opérations supplémentaires dans un espace 
vectoriel, cet ensemble possédera une structure nou¬ 
velle, et nous lui donnerons un autre nom. Nous allons 
étudier rapidement ici les espaces métriques et les 
espaces vectoriels normés. 

• Espaces métriques. Des éléments — que nous 
nommerons points — constituent un espace métrique 
E si l’on peut définir une règle qui fait correspondre à 
deux points quelconques x et y un nombre D(x, y) 
appelé distance entre x et y et tel que : 


D(x, x n ) < e ; (1) 

la suite x n est dite convergente vers x. En d’autres 
termes, si tous les points de la suite, à partir d’un point 
quelconque, appartiennent à toute boule de centre x 
(et de rayon e), la suite est convergente vers x. On 
écrit : 

x = lim x n , (2) 

ce qui se lit: « x = limite de x n quand n tend vers 
l’infini » ; ou encore : 

x n > x (3) 

(lire : « x n converge vers x »). 

Le lecteur a bien noté qu’on ne peut parler de suite 
convergente que si l’espace auquel appartient x est 
muni d’une métrique ; sinon la notion n’aurait pas de 
signification. Enfin, s’il n’existe aucun x E E, tel que 
x n —► x, la suite est dite divergente. 


NOTIONS FONDAMENTALES. 


L’introduction historique qui vient d’être faite montre 
qu’il existe, en analyse, des théories nombreuses et 
diverses, reliées par certains liens, par exemple par le 
fait qu’on utilise dans toutes ces théories des notions 
comme infiniment petit, continuité, limite, différen¬ 
tielle, intégrale, etc. Il ne peut être question, ici, de 
résumer un cours d’analyse : nous allons nous conten¬ 
ter d’en présenter les grandes lignes. Pour cela nous 
étudierons d’abord les notions fondamentales sans 


1 - D(x, y) > 0, pour x^y; 

D(x, x) = 0, pour tout x ; 

2 - D(x, y) = D(y, x) ; (2) 

3 - D(x, z) D(x, y) 4- D(y, z), pour tout x, y, z. 

La règle D est la métrique de l’espace E. 

L’exemple le plus simple d’un espace métrique est la 
droite numérique : les éléments x, y, ... sont les points 
de la droite (c’est-à-dire les nombres réels), et la 
distance D(x, y) n’est autre que la valeur absolue de 
la différence des deux nombres x et y, soit 
D(x, y) = I x - y I. 


Exemples et problèmes. 

• Exemples. Si E est l’espace des réels, avec la 
métrique D(x, y) = I x - y |, la suite est dite numérique. 
Prenons par exemple la suite x„ = 1 /n (nE N*). 
Est-elle convergente et, si oui, vers quel nombre 
converge-t-elle ? Il ne suffit pas de dire « on voit bien 
que plus x est grand, plus 1/n est petit, donc la limite 
de x n pour n—o est 0 ». Le résultat est vrai, mais la 
manière dont on l’obtient n’est pas rigoureuse (et 
pourtant on procédait de la sorte au XVIII e siècle !). 

Il faut raisonner ainsi : choisissons un entier naturel 
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SUITES CONVERGENTES 


N > 1/e (e > 0) ; alors, pour tout n ^ N, on a : 


donc, puisque x n = 1/n : 

0 < x n < e . (5) 

De sorte que les points x n , quel que soit n ^ N, 
appartiennent à toute boule de centre O et de rayon 
e : donc x n —» x. 

Si l’on ne prend pas la précaution de raisonner avec 
autant de rigueur, on ne se trompera sans doute pas 
pour la suite x n = 1/n; mais pour des suites plus 
sophistiquées, la convergence n’est pas aussi évidente, 
et il faudra faire appel à ce type de raisonnement. 

• Le problème général posé par une suite dans 
un espace métrique est donc de décider si elle est ou 
non convergente. Un certain nombre de théorèmes, 
que nous n’énoncerons pas ici, permettent de résoudre 
ce problème sans refaire toujours les mêmes et fasti¬ 
dieuses démonstrations. Par exemple on démontre que 
si les suites numériques x n et y n convergent respecti¬ 
vement vers x et y, alors leur somme x n + y n converge 
vers x + y ; etc. 

• Deux définitions importantes peuvent mainte¬ 
nant être introduites. 

— Si pour tout e > 0 et tout entier naturel N on 
peut trouver un nombre n tel que : 

D{y, x n ) < e , (6) 

le point y est appelé une valeur d’adhérence de la suite 

x n . 

Cette définition — à première vue — ressemble à 
celle d’un point de convergence, les relations (1) et (6) 
ayant la même forme. Mais il ne faut pas s’y tromper, et 
nous allons le comprendre en examinant deux boules 
dont le centre est x dans un cas (valeur de conver¬ 
gence) et y dans l’autre (valeur d’adhérence) : 

1 - si x est une valeur de convergence, c’est-à- 
dire la limite de x n , cela signifie que tous les points x n 
appartiennent à la boule de centre x et de rayon e si 
l’on prend n suffisamment grand ; 

2 - si y est une valeur d’adhérence, cela signifie 
que, si n est suffisamment grand, des points x n appar¬ 
tiennent à la boule, mais pas nécessairement tous. 

En d’autres termes, si la suite x n est convergente, sa 
limite x est une valeur d’adhérence unique, et c’est 
pourquoi on peut l’appeler « limite ». Sinon, il peut 
exister une ou plusieurs valeurs d’adhérence (il peut 
aussi ne pas exister de valeur d’adhérence) et la suite 
ne converge pas (voir exemples au paragraphe c 
ci-dessous). 

— La deuxième définition à introduire est celle 
de point d’accumulation. Soit A un sous-ensemble 
d’un ensemble métrique E et y un point quelconque de 
E ; si toute boule de centre y contient un point x G A 
autre que y, y est dit point d’accumulation de l’ensem¬ 
ble A. Comme nous avons dit plus haut qu’une boule 
de centre x 0 s’appelait aussi un voisinage de x 0 , nous 
pouvons aussi nous exprimer ainsi : y est un point 
d’accumulation de l’ensemble A si tout voisinage de y 
contient x E A (x ^ y). 


Représentation et compléments. 

• Droite numérique. Soit l’ensemble U des 
réels ; son image est une ligne droite infinie, dont 
chaque point (au sens géométrique) est l’image d’un 
point (au sens ensembliste) appartenant à IR, c’est-à- 
dire d’un nombre réel x, y, ... Définissons la distance 
entre deux points x et y comme la valeur absolue 
I x — y I de la différence des deux réels x et y : l’ensem¬ 
ble IR est alors un espace métrique. Une boule de 
centre x et de rayon e est figurée par un segment de 
centre x et de longueur 2 e. Une suite x n est conver¬ 
gente vers x si, pour n suffisamment grand, tous les 
points images des nombres x n appartiennent à ce 
segment. En revanche x n’est qu’une simple valeur 
d’adhérence si, pour n suffisamment grand, il existe 
un/des points à l’intérieur du segment de centre x, 
mais aussi un/des points à l’extérieur de ce segment. 

• Ensembles quelconques. Soit un espace 
métrique E dont la nature des éléments, que nous 
appelons des points, ne nous intéresse pas ici. On peut 
utiliser les diagrammes ensemblistes classiques pour 
figurer une boule de centre x et de rayon e dans cet 
ensemble. Un point x n appartient à la boule si le 
nombre D(x, x n ) est inférieur ou égal à e (bien 
entendu, il faudrait définir la règle de détermination du 
nombre D, mais cela fait partie, précisément, de la 
donnée d’espace métrique). 

Si, à partir de n suffisamment grand, un élément 
x n E E et tous les éléments x n+1 , x n+2 , ... se trouvent 
dans la boule (x, e), la suite { x n } converge vers x. Si, 
toujours dans les mêmes conditions, certains éléments 
à partir de x n se trouvent dans la boule et d’autres à 
l’extérieur de la boule, x est une valeur d’adhérence 
pour la suite { x n }. Enfin la boule (y, r) dans A contient 
au moins un point autre que y appartenant à A : y est 
un point d’accumulation de l’ensemble A. 


E est un espace métrique, dont les points x, x u etc., 
sont les éléments. La suite {x n } converge vers x si, 
pour n suffisamment grand, tout point tel que x n , x n+1 , 
..., x n+i , ..., appartient à la boule (en rose). Si certains 
points x n+i n’appartienne pas à la boule, x est une 
valeur d’adhérence. Enfin y est un point d’accumula¬ 
tion de A (en bleu) si la boule (y, r) contient un point de 
A autre que y (le point x A par exemple). 



• Remarques complémentaires : 

1-11 existe des théorèmes assurant l’existence 
ou la non-existence de points d’accumulation ou de 
valeurs d’adhérence pour certaines grandes classes 
d’ensembles (par exemple, le théorème de Bolzano- 
Weierstrass pour les réels : tout segment [a, b] des 
réels possède au moins un point d’accumulation ou 
une valeur d’adhérence). 

2 - Étant donné une suite x,, x 2 , ..., s’il existe un 
entier N tel que, pour n et m 2 * N, on ait D(x n , x m ) e 
(c’est-à-dire que, pour n et m suffisamment grands, la 
distance entre x n et x m devient aussi petite que l’on 
veut), la suite est dite suite de Cauchy. On démontre 
que toute suite convergente est une suite de Cauchy et 
que toute suite de Cauchy est bornée. 

3 - Un espace métrique est dit complet si toute 
suite de Cauchy de ses éléments converge vers un 
élément de cet espace (c’est le cas des réels, dotés de 
la métrique Ix-yl). Un espace vectoriel normé 
complet est un espace de Banach (voir ci-contre, 

p. 106). 

4 - Un espace non complet peut être inclus dans 
un espace complet (théorème de Hausdorff). 

5 - Un espace métrique dans lequel toute suite 
{x n } possède une valeur d’adhérence est appelé 
compact. On démontre que tout espace compact est 
complet. 

Conclusion pratique. 

Nous raisonnerons principalement sur l’ensemble IR 
des réels, muni de la métrique D(x, y) = l x — y I. 
D’après ce qui vient d’être dit, c’est un espace 
complet. Donc toute suite réelle x 1t x 2 , ... telle que 
l’inégalité I x n - x m I < e est satisfaite pour tout e > 0, 
dès que n et m sont plus grands que N est une suite 
convergente. Cette propriété est appelée critère de 
Cauchy, et elle n’a rien d’évident a priori. 

En revanche, R n’est pas compact, car il existe des 
suites réelles qui n’ont pas de valeur d’adhérence dans 
IR (par exemple la suite 1, 2, ..., n, ...). Toutefois, 
puisque nous avons dit (remarque n°1) que tout 
intervalle [a, b ] possédait au moins une valeur d’adhé¬ 
rence, l’intervalle [a, b ] est compact : nous dirons que 
R est localement compact. 

Lorsque nous aborderons le développement de 
l’analyse, et principalement la théorie des fonctions, 
nous serons conduits à examiner la ou les valeurs 
prises par une fonction f(x) quand x tend vers une 
valeur x 0 particulière. Si x est réel et si f(x) est réel, 
nous pourrons utiliser les définitions et propriétés des 
suites convergentes pour étudier ce problème. Si x est 
complexe, il faudra s’assurer que les théorèmes sont 
valables sur €. Si x n’est pas un nombre, mais « autre 
E chose», les mêmes précautions devront être prises. 
Jusqu’aux environs de 1810-1820, les mathématiciens 
ont raisonné sur les fonctions d’une variable réelle 
sans trop se soucier de ces préliminaires sur les suites. 
Mais cette attitude interdirait tout progrès de l’analyse, 
et le besoin de définition rigoureuse de la convergence 
s’est fait sentir au début du XIX e siècle, si l’on voulait 
éviter le piège des cercles vicieux. 


Quelques grands mathématiciens qui ont contribué aux progrès de l’analyse au XIX e siècle et au début du XX e siècle. De gauche à droite ; Augustin Cauchy (1789-1854), qui est à 
l’origine de la théorie des limites, de la théorie des séries, de la théorie des fonctions analytiques ; Bernhard Riemann (1826-1866), qui a renouvelé la théorie des fonctions d’une 
variable complexe et qui est l’initiateur de la géométrie algébrique et de la topologie ; Karl Weierstrass (1815-1897) — « notre maître à tous » disait Hermite en 1900 — qui a 
généralisé les théories de l’analyse classique et présidé au renouveau de cette science (Peinture de F. Duda) ; Henri Poincaré (1854-1912), auteur de travaux fondamentaux sur la 
théorie des fonctions, la topologie, le calcul des probabilités ; Henri Lebesgue (1875-1941), qui a généralisé la notion d’intégrale, développé la théorie des fonctions de variables 

réelles et la théorie de la mesure. 



107 





THÉORIE DES LIMITES 


Théorie des limites. 

La notion de fonction a été définie en théorie des 
ensembles, p. 20 ; nous n’avons pas à revenir sur 
cette définition. Rappelons simplement la notation 
employée : on appelle x les éléments d’un ensemble E 
et f(x) les éléments d’un ensemble F mis en corres¬ 
pondance par une loi /"déterminée. On écrit alors : 

E—^F ou x f(x). (1) 

L’expression f{x) se lit «fdex » ou « fonction de x ». 
Si x est un nombre et f(x) un nombre, la fonction est 
numérique ; mais ce n’est là qu’un cas particulier 
(néanmoins très important... !). Voir aussi p. 109. 

Définitions générales. 


une fonction donnée sur cet ensemble, l’ensemble F 
auquel appartiennent les éléments y = f(x) étant doté 
d’une métrique D, et soit S une direction (au sens de la 
définition précédente). S’il existe un élément L G F tel 
que, pour tout s > 0, on peut trouver un ensemble 
A G S pour tous les éléments y duquel on a : 

D(L, y) < e , (3) 

l’élément L est appelé limite de la fonction y = f(x) 
selon la direction S. On écrit : 

L = lim f (x ), (4) 

s 

ou plus simplement : 

f(x)->L (5) 

(la flèche se lit « tend vers » ; ne pas la confondre avec 
la flèche — f —+ définissant une application). 


Considérons la fonction numérique f(x) = x - 1 et 
donnons à x des valeurs positives supérieures à 1, par 
exemple : 

x., = 1,1 ; x 2 = 1,01 ; x 3 = 1,001 ; ... ; 

x n = 1,00 ... 1, ... (2) 

n termes 

Nous constatons intuitivement que la différence 
x - 1 diminue au fur et à mesure que n augmente : elle 
vaut 10 _1 pour x = x 1t 1CT 2 pour x = x 2 ; ... 10 n pour 
x=x n> ... Comme nous avons confiance (pourquoi 
donc ?) dans la structure de l’ensemble des réels, nous 
avons tendance à affirmer : « quand n tend vers l’infini, 
x n - 1 tend vers 0, donc quand x tend vers 1 par 
valeurs positives, la fonction f{x) tend vers 0 et l’on 
peut écrire /"(O) = 1 ». Cette intuition — vraie en l’occur¬ 
rence — ne peut plus s’exercer si x et f(x) ne sont pas 
des nombres réels. D’où la nécessité de définir d’une 
manière générale la notion de limite d’une fonction 
f(x), quitte à retrouver des méthodes particulières dans 
le cas des fonctions numériques. 

• Notion de direction. Soit E un ensemble, soit 
S = {A, B, C,... } un système de sous-ensembles A, B, 
C, ... de E. Si, pour tout couple de ces sous-ensembles, 
A et B par exemple, on a soit A d B, soit B C A, et si 
l’intersection de tous les ensembles A est vide, S est 
appelé une direction. 

• Définition de la limite d’une fonction. Soit un 
ensemble E, composé d’éléments x, soit y= f(x) 

Camille Jordan (1838-1922) : son œuvre a pro¬ 
longé celle d’Evariste G al ois en ce qui concerne la 
théorie des équations ; il est aussi à l’origine de la 
topologie. Le portrait ci-dessus a été fait par son 
oncle, P. Puvis de Chavannes, en 1858. 


Exemples. 

• Donnons d’abord des exemples de direction 
S. Considérons l’ensemble E = N* (entiers naturels) et 
considérons le système S de sous-ensembles A l5 A 2 , 

* 3 . 

={ 1,2,3,...}; 

A 2 = {2,3, 

A n = { n, n+ 1, n + 2,...} ; w 

etc. 

Quels que soient deux sous-ensembles A n et A m , on 
a toujours soit A n C A m , soit A m C A n (il y en a toujours 
un des deux qui est inclus dans l’autre). D’autre part, il 
est clair qu’il n’existe aucun nombre entier qui appar¬ 
tienne à la fois à tous les ensembles A n : l’intersection 
de tous ces ensembles est vide. On peut donc dire que 
S est une direction, au sens du paragraphe a. Pour 
désigner cette direction, nous écrirons : 

n^o o (7) 

(« n tend vers l’infini »), car on ne peut affirmer que 
l’intersection : 

>a 1 n a 2 n ... n A n n ... (8) 

n’est vide que si n tend vers l’infini : l’intersection 
A, D A 2 n’est pas vide, et pas davantage n A 2 n A 3 , 
etc. ; elle n’est vide que pour n—o. 

— Soit l’ensemble E = { réels positifs xs=a}, 
qui s’écrit : 

E = { a, ...} (9) 

Considérons le système S des sous-ensembles A a , 
formés d’éléments x G E, tels que x a ; par exemple, 

si a = \ 2 > a : 



A VI ={V2, ...} (10) 

Ici aussi, deux sous-ensembles quelconques A a et A p 
sont toujours inclus l’un dans l’autre, et l’intersection 
de tous les ensembles A a est vide : S est une direction 
qu’on note : 


X —> + oo . (11) 

— De même l’ensemble E = {réels x a } pos¬ 
sède la direction : 


X > ± oo . (13) 

• Exemples de limites. 

— Soit E = {réels positifs x ^ a } et la fonction 
numérique f{x) appartenant à l’espace métrique F, la 
métrique étant définie par la valeur absolue de la 
différence entre deux éléments, qui est la métrique 
classique attribuée aux réels. Si, pour x —» + oo, il existe 
une valeur L G F telle que, pour tout e > 0 on ait : 


I L- ~ f(x) | 


L est la limite de la fonction pour la direction 
S = x —► 4- oo, et on écrit : 


(15) 


s — Soit E = U et supposons encore que les 

| fonctions f{x) prennent leurs valeurs dans IR (c’est-à- 
1 dire F = IR). S’il existe un réel L tel que, pour x —> a, on 
ait, pour tout e > 0 : 

. \L-f(x)\^e, (16) 

; L est la limite de la fonction pour x^a et l’on écrit : 


(Bien noter que nous ne cherchons pas la valeur de x 
pour x = a, mais le comportement de la fonction quand 
x tend vers a, ce qui n’est pas la même chose.) 


X > oc (12) 

et l’ensemble IR des réels possède les directions + oc et 
- oc, qu’on note : 


• Remarques : On démontre les théorèmes 
généraux suivants : 

1 - Si une fonction f(x) est constante et prend la 
même valeur L pour tout x appartenant à E, alors elle 
admet L comme limite suivant S. 

2 - Une fonction f(x) ne peut avoir qu’une limite 
selon S. 


Cas des fonctions numériques réelles. 


Nous allons considérer les fonctions définies par 
l’application IR—^—> IR, c’est-à-dire dont les variables x 
appartiennent aux réels et dont les valeurs f{x) appar¬ 
tiennent aussi aux réels. 

• Généralités. Étant donné une fonction numé¬ 
rique y = f{x), on calcule sa limite dans une direction 
S(x—»a ou x—>±oo), en appliquant des théorèmes 
généraux dont l’ensemble constitue la théorie des 
limites et que nous n’énoncerons pas ici. 

Nous retiendrons toutefois deux définitions impor¬ 
tantes, qui nous serviront par la suite, et qui concer¬ 
nent la comparaison de deux fonctions f(x) et g(x). 

— La fonction f(x) est dite infiniment petite par 
rapport à g(x) si : 

lim Tiili =0. (18) 

s g (x) 

— La fonction f(x) est dite infiniment grande par 
rapport à g(x) si, en valeur absolue : 


lim 

s 


f_jx) 

g(><) 


— 00 


(19) 


— Les fonctions f(x) et g(x) sont dites équiva¬ 
lentes selon S si : 


lim 

s 

Il résulte de (20) que 
lim 

s 

alors : 

lim 


f(x) 

g(x) 

(20) 

i si l’on a en outre : 


g(x) . 

h(x) 

(21) 

f(x) , 

h(x) 

(22) 


D’où une règle usuelle : pour chercher la limite d’un 
rapport, on peut remplacer le numérateur et/ou le 
dénominateur par des fonctions équivalentes. 

• Limite d’une fraction rationnelle pour 
x —» ± °°. Sous sa forme générale, une telle fonction 
s’écrit : 


f(x) 


a 0 x m + a 1 x m 1 + ••• + a m „i x + a m 
b 0 x n + b 1 x n 1 + --* + fc> n1 x + b n 


(23) 


Supposons a 0 / 0 et b 0 / 0 ; on peut mettre a 0 x m et 
b 0 x n en facteur dans les deux termes, d’où : 


f(x) 


b o x" 



a m 

+ — 


âo 




1 b n 1 \ 

x bo X I 


(24) 


quand |x|—><», les termes en 1/x, 1/x 2 , ..., 1/x m , ... 
tendent vers 0, ce qui permet d’écrire les parenthèses 
sous la forme 1 + e(x), en convenant d’écrire sous la 
forme e(x) toute fonction qui tend vers 0 quand 
| x | —> °°. L’équation (24) devient: 


a Q x m [1 + g (x)] 

1 > bo x n [1 + e (x )] 

Quand x—>±oo, g(x) tend vers zéro et : 


f(x) 


a 0 x 
b o x n 



de sorte que : 


lim f(x 


a o 

— , si m = n , 

b o 

0 , si m < n . 


(25) 


(26) 


(27) 


Si m > n, f(x) a une limite infinie dont le signe est 
celui de a 0 /b 0 . 

Exemple : la fonction : 


f(x) 


— 3 x 2 + 5 x -1 
x 2 — 7 x +3 


(28) 


a pour limite a 0 /b 0 = - 3 quand x—>±oc. De même 
f(x) = ax tend, en valeur absolue, vers l’infini, quand 
x —> ± oo, avec les cas suivants : 
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LA NOTION DE FONCTION 


r x^-ac, alors f{x) - œ ; 
a > 0 l 

L x —> 4- se ? alors f(x) —> + oo . 

(29) 

(x^ - oc , alors f(x)—> + c° ; 
a < 0 | 

t x —> -F oc j alors f{x)—> — a°. 

• Application de la théorie des limites aux suites 
numériques. Nous allons retrouver ici le critère de 
Cauchy : une suite de nombres x n possède une limite 
finie (= converge) si, et seulement si, pour e > 0, il 
existe un nombre N tel que, pour tout m, n ^ N on ait : 

| x m - x n | < e . (30) 

Un exemple des plus intéressants est celui de la 
suite : 


u n 



(n = 1 , 2 ,...). 


(31) 


Le lecteur notera d’abord que u n est un binôme de 
Newton, comme nous l’avons étudié en analyse combi¬ 
natoire, p. 33; en faisant a = 1 et x = 1/n, et en 
développant le binôme selon la formule donnée à ce 
paragraphe, on trouve : 


. . 1 n (n 

U n = 1 + 1 + — -'-: 

2 n‘ 


= 1 + 1 + 


2 ! 


1) 1 n n 

— L -|--- 

3 ! 

_A_ 

n 


1)(n -2) 


1 — l + 3! (1 


1 


(32) 


On démontre, par la théorie des limites, que la suite 
u n est convergente et l’on désigne classiquement sa 
limite par e : 

1 + = e (33) 



L’examen de la formule (32) montre que e est 
compris entre 1 + 1 = 2 et 3 : 

2 < e < 3 . (34) 

En faisant n = 1,2, 3,... on peut obtenir des approxi¬ 
mations de e, et l’on trouverait : 

e = 2,718 28... (35) 


FONCTIONS D'UNE VARIABLE 
RÉELLE. 


Généralités sur la notion de fonction. 


Rappel de la définition générale. 


Soit deux ensembles X et Y ; appelons X Vensemble 
de départ et Y \’ensemble d’arrivée. On appelle fonc¬ 
tion la mise en correspondance d’éléments x de X 
avec des éléments y de Y, cette opération s’appelle 
une application, et on la désigne usuellement par des 
lettres comme f, g, h, ... On dit que x est la variable, 
l 'antécédent ou Vargument de la fonction, et y l ’image 
ou la valeur de la fonction. On écrit indifféremment : 


Y ; 

y ; 


x^f(x); 
y = f(x ). 


( 1 ) 


Il peut se trouver que l’application f ne concerne 
qu’une partie E de l’ensemble X (E C X) et que les 
valeurs y de la fonction soient prises dans un 
sous-ensemble F de Y. E c X est appelé domaine de 
définition de la fonction ; F est le domaine des valeurs. 
Si E = X, la fonction est dite partout définie dans X. 


Fonctions de variables réelles. 

Convenons de prendre comme ensemble de départ 
l’ensemble U des réels ; toute application R —Y est 
une fonction de variables réelles. 

• Fonctions numériques et fonctions vectoriel¬ 
les. Deux cas sont particulièrement intéressants, car ils 
correspondent notamment aux préoccupations des 
physiciens et à une combinatoire concrète à laquelle 
l’esprit humain s’est habitué depuis 2 500 ans qu’il fait 
des mathématiques. 

— Premier cas : YçR. Cela signifie qu’à cha¬ 
que réel x de l’ensemble E de définition on fait 
correspondre un réel f(x) de l’ensemble des valeurs. La 
fonction est dite numérique. En voici quelques exem¬ 
ples simples. 

y = 3 x + 1 ; y = —x 2 + x +1; Y (2) 

— Deuxième cas : Y est espace vectoriel sur IR 



Cette photographie stroboscopique fixe à divers instants les mouvements d’un lanceur de disque. D’une façon 
analogue le calcul infinitésimal est utilisé pour figer un mouvement complexe et pour analyser le processus de la 

variation instant par instant. 


(ou F un sous-espace de V). Cela signifie qu’à 
chaque réel x de l’ensemble E de définition, on fait 
correspondre un vecteur à 1, 2 ,..., n composantes, 
selon le nombre de dimensions de l’espace Y choisi. La 
fonction est alors dite vectorielle à n variables réelles. 
Si n = 1, elle est appelée fonction d’une variable 
réelle ; si n = 2, elle est à deux variables réelles ; etc. 
On notera que, si n = 1, on est ramené au cas d’une 
fonction numérique (en effet un nombre réel peut être 
considéré comme un vecteur à une dimension). 

Par exemple le vecteur r = OJIfqui définit la position 
d’un point M dans le plan rapporté à deux axes de 
coordonnées est une fonction vectorielle des coordon¬ 
nées x et y (réelles) du point M. La fonction : 

r = f(x, y) (3) 

est une fonction vectorielle de deux variables réelles, x 
et y. 

• Exemples et précisions. 

— La quantité de chaleur dégagée par un cou¬ 
rant d’intensité / pendant le temps t dans une résis¬ 
tance R est donnée par la loi de Joule : 

Q= RI 2 t, (4) 

Q est une fonction numérique de trois variables R, I et t 
indépendantes les unes des autres. 

— La surface S d’un triangle dont les côtés 
mesurent x, y, z et dont le demi-périmètre est égal à p a 
pour valeur (voir p. 143) : 

S = Vp(p zr x)Tp zr ÿ)Jp zr z ). (5) 

S est une fonction des trois variables indépendantes 
x, y, z ; p n’est pas une variable indépendante, car on le 
calcule à partir de : 


Nous pourrons donc écrire : 

S = f(x , y, z). (7) 

— Une fonction numérique exprime une relation 
entre des nombres réels, cette relation peut être don¬ 
née sous une forme explicite : 

y = f(x) (8) 

ou sous une forme implicite : 

F(x, y) = 0 . (9) 

Par exemple la fonction y donnée par la relation : 

y 2 + x 3 = 0 (10) 

est une fonction implicite. Si nous résolvons (10) par 
rapport à y, il vient aussi : 

y = V- x 3 = - x 3/2 ; (11) 

c’est une fonction explicite de x. 

Calcul et représentation des fonctions. 

• Tables. Certaines fonctions numériques sont 
d’un usage très courant ; on a donc calculé une fois 
pour toutes leurs valeurs, et on les a imrpimées sur des 
tables fonctionnelles, d’un emploi plus ou moins 
compliqué (exemples : tables de logarithmes, tables de 
fonctions circulaires, etc.). Ces tables ont maintenant 
laissé la place aux calculatrices électroniques, depuis 
les petites calculatrices de poche jusqu’aux 
« ordinateurs » géants : le programme de calcul des 
fonctions courantes est introduit dans la machine, une 
fois pour toutes, et on obtient la valeur de la fonction 
en appuyant sur quelques touches. 

• Graphiques. 

1 - Fonctions d’une variable réelle y = f(x) : il 
est commode de se faire une idée géométrique de 
telles fonctions en portant sur un axe Ox les valeurs de 
la variable et sur un axe Oy la valeur correspondante 
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FONCTIONS CONTINUES 

de la fonction. Chaque couple (x^ y A ), (x 2 , y 2 ), ... de 
coordonnées fournit un point du plan xOy et, en reliant 
tous ces points par un trait continu on obtient le 
graphique de la fonction, à savoir une courbe plane 
d’équation y=f(x). 



La courbe qui joint les points /W, et M z . est le 
graphique de la fonction y = f(x) définie dans l’inter¬ 
valle [x r , ,x 2 ] de R. 


2 - Fonctions de deux variables réelles : 
z = f(x, y). A deux valeurs x 1 et y 1 des variables 
correspond un point m, du plan xOy. Portons la valeur 
correspondante de z 1 sur l’axe Oz perpendiculaire à 
xOy : on définit un point /W 1 de l’espace de coordon¬ 
nées (x 1? y v z,), avec z 1 = f(x 1t y 1 ). L’ensemble des 
points ainsi construits constitue une surface. Si la 
fonction est « simple » la surface peut souvent être 
dessinée facilement. Exemples : 

— la fonction z = ax + by + c est représentée 
graphiquement par un plan, dont l’obliquité par rap¬ 
port aux plans du repère dépend des coefficients a et b 
(appelés coefficients angulaires) ; 

— la fonction z = x 2 + y 2 est représentée par un 
paraboloïde de révolution (voir figure) ; 

— etc. 



La fonction z = x 2 + y 2 est représentée par un para¬ 
boloïde de révolution. Les coordonnées (x, y, z) du 
point M s’obtiennent aisément en projetant M sur 

xOy : on a Op = x et Oq = y. La relation x 2 + y 2 = Om 2 

(Pythagore) permet de construire z = Or 2 = Om 2 . 


3 - Si le nombre n de variables dépasse 2, on ne 
peut plus représenter graphiquement la fonction. A ce 
niveau, la vision géométrique des faits est largement 
dépassée par la méthode analytique. 


Définitions complémentaires. 

• Fonctions inverses. Soit une fonction numéri¬ 
que y = f(x), dont la variable indépendante est x ; il est 
possible d’en déduire la fonction x = <p(y), dans 
laquelle y joue le rôle de variable indépendante. Les 
fonctions f et sont dites inverses (ou réciproques), et 
l’on écrit parfois <p = L’opération qui permet de 
passer de f à (p (ou de <p à f) est une inversion. 

Par exemple y = ax + b a pour inverse la fonction : 



La fonction y = x 3 a pour inverse : 

x = Vy r . (13) 

La fonction y = e x , e étant la limite de (1 + 1/n) n 
quand n—> °o (voir p. 109) a pour inverse une fonction 
<p(y) que nous étudierons p. 116 et qu’on appelle, pour 
des raisons historiques, logarithme népérien de y 
(symbole : In) : 

<p(y) = In y. (14) 

• Fonctions univoques, multivoques. Une fonc¬ 

tion est dite univoque lorsqu’à une valeur de x corres¬ 
pond une et une seule valeur de y. Par exemple 
y = 3 x + 5, y = x 2 , y = 1/x sont des fonctions univo¬ 
ques. 

Quand, pour une même valeur de x, une fonction 
prend deux ou plusieurs valeurs distinctes, elle est dite 
multivoque. Par exemple y = V>Test multivoque, puis¬ 
que pour x = 4 par exemple, on a y = ± 2. 

• Fonctions composées. Soit la fonction numé¬ 

rique y = f(u), dans laquelle u est une variable réelle. 
Supposons que u soit elle-même fonction d’une autre 
variable numérique x, relation fonctionnelle que nous 
écrirons u(x). Alors on peut écrire : 

y=f(u)=f[u(x)]=F(x). (15) 

La fonction y = F(x) est une fonction composée, ou 
encore une fonction de fonction : y est fonction de x 
par l’intermédiaire de u(x). 

• Caractères des fonctions numériques. Les 
principes de description des fonctions numériques 
sont nombreux, puisqu’on peut choisir des critères 
divers. 

— On peut distinguer les fonctions numériques 
en fonctions algébriques et fonctions transcendantes, 
selon que leurs valeurs sont des réels algébriques ou 
transcendants. Ainsi y = ax 2 + bx+ c est une fonction 
algébrique, mais y= e x et y= In x sont des fonctions 
transcendantes. 

— On peut les caractériser d’après le domaine 
géométrique qu’elles recouvrent : les fonctions circu¬ 
laires (sin x, cos x, tan x, cot x) sont liées au cercle ; 
les fonctions elliptiques, hyperboliques sont liées à 
l’ellipse et à l’hyperbole ; la fonction linéaire est liée à 
la ligne droite. 

— On peut aussi considérer leurs caractéristi¬ 
ques, et parler de fonctions continues, monotones, 
dérivables, etc. Mais alors nous nous apercevons que, 
pour découvrir ces caractères, il nous faut faire appel à 
des outils nouveaux, qui ont été précisément forgés 
par l’analyse, et en particulier à la notion de dérivée 
qui est l’instrument par excellence de l’étude des 
fonctions (voir ci-après, p. 113). 

— Enfin il ne faut pas oublier qu’il y a des 
fonctions non numériques, et que leur étude est un 
chapitre très important de l’analyse. 

• Qu’est-ce donc qu’ « étudier une fonction » ? 
Ce n’est pas simplement calculer ses valeurs dans un 
intervalle donné. C’est se poser à son sujet de nom¬ 
breuses questions sur : 

1 - son domaine de définition ; 

2 - sa continuité (voir ci-dessous, paragra¬ 
phe e) ; 

3 - la manière dont elle varie par rapport à la 
variable (fonction croissante, décroissante ou 
constante) ; 

4 - ses valeurs remarquables pour certaines 
valeurs de la variable (valeurs maximales et minimales, 
etc.) et ses limites quand la variable tend soit vers ± », 
soit vers des valeurs particulières ; 

5 - la traduction graphique de tous ces faits, et 
l’allure de la courbe obtenue. 

La clef de tous ces problèmes est fournie par l’étude 
des dérivées d’une fonction. Mais, avant d’aborder 
cette notion, il nous faut définir avec rigueur la notion 
de fonction continue. 

Continuité. 

• Définition. L’idée de continuité est intuitive : 
une courbe qu’on peut tracer sans lever la main qui 
tient le crayon est « continue » ; si le tracé est inter¬ 
rompu en un point et reprend en un autre, on parle de 
« discontinuité » au point de rupture. C’est à Bolzano 
(1817) et à Cauchy (1821) que l’on doit les premières 
définitions rigoureuses de la continuité d’une fonction. 
Voici la définition donnée par Cauchy dans son cours 
d’analyse : 

« La fonction f(x) restera continue par rapport à x entre 
les limites données [entre ces limites, la fonction est 
supposée partout définie] si, entre ces limites, un 
accroissement infiniment petit de la variable produit 
toujours un accroissement infiniment petit de la fonc¬ 
tion elle-même ». 


Nous pouvons exprimer cette définition simple avec 
le langage des mathématiques modernes. Supposons 
que l’ensemble E auquel appartient la variable x et 
l’ensemble F auquel appartient la fonction f(x) sont 
des espaces métriques, et soit a Œ E un point fixe non 
isolé (c’est-à-dire un élément déterminé de E qui peut 
être le centre d’une boule). La fonction f(x) est dite 
continue pour x = a si : 

lim f(x) = f(a). (16) 

(Cette définition suppose en outre qu’on ait défini la 
direction x—»a comme on l’a fait au n° 517.2, C.) 
Autrement dit, f{x) est continue pour x = a si, quel que 
soit s > 0, il existe une distance 8 telle que D{ x, a) <8 
implique 

D[f(x),f(a)]<s. (17) 

Si E et F sont des ensembles de réels munis de la 
métrique I x — y I, alors l’inégalité (17) s’écrit: 

| f(x)-f(a)\<e. (18) 

• Remarques. 

1 - Une autre définition de la continuité, liée à la 
théorie des limites et des suites convergentes, est la 
suivante : f(x) est continue pour x = a si, pour toute 
suite convergente x n -> a de la variable on a une suite 
convergente f{x n )-*f(a) de la fonction. 

2 - Tout point tel que a est appelé un point de 
continuité. 

3 - Si deux fonctions numériques f(x) et g(x) 
sont continues pour x = a, alors : 

— f(x) + g(x) est continue pour x = a ; 

— f( x ) 9(x) est continue pour x = a ; 

— f(x)/g(x) est continue pour x= a si g(a) ^ 0. 

4 - De ces trois propositions il résulte : 

— que tout polynôme 

P(x) = a 0 x" + a, x"- 1 + ••• + a„ 
est continu pour toute valeur de x; 

— que toute fonction rationnelle P(x)/Q(x) est 
continue pour toute valeur de x différente des zéros de 
son dénominateur ; par exemple la fonction homogra- 
phique : 


ax + b 

a'x + b’’ 


(19) 


quotient des polynômes ax + b et a' x + b’ est continue 
pour toutes les valeurs de x£ IR, sauf pour x= — b'/a', 
zéro du polynôme figurant au dénominateur ; de même 
la fonction : 


y = 


ax 2 + bx + c 

a'x 2 + b ' x + c ' 


( 20 ) 


est continue pour toutes valeurs réelles de x, sauf 
pour : 


— b'±\/b' 2 — 4a'c' 
2a^ 


( 21 ) 


qui sont les zéros de son dénominateur. 

5 - Théorème de Bolzano : si une fonction f(x) 
est continue sur un intervalle [a, b] de R et si elle prend 
des valeurs de signes contraires à ses extrémités, alors 
il existe dans l’intervalle un nombre c tel que f(c) = 0 
(graphiquement, cela signifie que si f(a) et f(b) sont de 
signes contraires, la courbe coupe l’axe des x en un 
point d’abscisse x = c). 

• Fonctions monotones. Soit deux valeurs x 1 et 
x 2 de la variable x dans un ensemble E C [R, et soit f(x A ) 
et f(x 2 ) les valeurs correspondantes de la fonction 
numérique f(x). L’inégalité x A < x 2 implique l’une des 
quatre inégalités suivantes : 

— f(x,) < f(x 2 ) : la fonction est dite croissante 
sur E ; 

— f(x^) > f(x 2 ) : la fonction est dite décrois¬ 
sante sur E ; 

— f(x^) f(x 2 ) : la fonction est dite non décrois¬ 

sante sur E ; 

— f(xj) s* f(x 2 ) : la fonction est dite non crois¬ 
sante sur E. 

Dans chacun des quatre cas, la fonction est dite 
monotone sur E. 

En résumé, et d’une manière semi-intuitive, une 
fonction est croissante dans un intervalle E lorsqu’elle 
augmente ou diminue en même temps que la variable ; 
elle est décroissante dans le cas contraire. Elle est dite 
monotone sur E lorsqu’elle est constamment crois¬ 
sante ou décroissante sur cet intervalle. 

• Discontinuités. Considérons la fonction 
f(x) = x — 1 ; il n’est pas difficile de voir que, lorsque 
x—>1, f(x)—>0, ce qui permet d’écrire f(1 ) = 0. Mais 
dire que « x tend vers 1 », cela signifie aussi bien que 
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DISCONTINUITES 


l’on se rapproche de 1 par valeurs inférieures à 1 : 
0,9 ... 0,99 ... 0,999 ... 0,999 999 ... 0,999 9 ... (22) 

n chiffres égaux à 9 
ou par valeurs supérieures à 1 : 

1,1 ... 1,01 ... 1,001 ... 1,000 001 ... 1,000^J ... (23) 

n chiffres décimaux 


Dans le premier cas, la différence x - 1 est négative ; 
dans le second cas, elle est positive, et c’est pour cette 
raison qu’on a considéré, plus haut, la valeur absolue 
| x — 1 | de ce genre de différences. 

Pour spécifier que la limite de f(x) quand x—> 1 est 
f( 1) 0 aussi bien lorsque x est à gauche de 1 qu’à 
droite de 1 (x < 1 ou x > 1), on écrit : 

— quand x—>1, avec x<1, 

lim f(x) = f(1 - 0) = f(1) = 0 ; (24) 

— quand x—>1, avec x>1, 

lim f(x) = f(1 + 0) = f(1) = 0 . (25) 

Dans le premier cas, la fonction est dite continue à 
gauche pour x-»1 ; dans le second cas, elle est 
continue à droite. Quand elle est — comme dans notre 
exemple — à la fois continue à gauche et continue à 
droite, elle est dite continue pour x= 1, et l’on peut 
écrire : 

f( 1 — 0) = f( 1 +0)= f(1). (26) 


Mais il n’en est pas toujours ainsi. Par exemple, la 
fonction g définie par : 

g(*)=3^r^ (27) 

se comporte différemment quand x tend vers 1, selon 
que cette variation de x se fait par valeurs inférieures 
ou par valeurs supérieures à 1. 

Si l’on prend pour x les valeurs : 0,9, 0,99, 
0,999 999, ..., 1/gf(x) prend successivement les valeurs 
-10 \ — 10 2 , - 10 6 , ..., donc g(x) = {-10, -100, 
- 1 000 000, ...} et l’on montrerait aisément que sa 
limite est - oo ; donc : 

fif(1-0) = -oc. (28) 

Si l’on fait tendre x vers 1 par valeurs supérieures à 
1 : x = {..., 1,1, 1,01,1,000 001,...}, la fonction prend 
les valeurs g(x) = { ... 10, 100, 1 000 000,...} et, quand 
x * 1 1 flf(x) —> + oc ; donc : 

g(1+0) = + oc. (29) 

On ne peut pas écrire g( 1 - 0) = g( 1 + 0) = g( 1) : la 
fonction est dite discontinue. 

Plus généralement, étant donné une fonction f(x) 
définie sur un intervalle E, et une valeur x 0 de la 
variable : 

— Si f(x 0 + 0) = f(x 0 - 0) = f(x 0 ), f{x) est une 
fonction continue pour x 0 ; dans tous les autres cas, 
elle est discontinue pour x 0 . 

— Si f(x 0 + 0) et f(x 0 - 0) sont finis et différents , 
on dit que x 0 est une discontinuité de première espèce. 
Le nombre f(Xo + 0)— f(x 0 -0) s’appelle le saut de la 
fonction au point x 0 ; si, de plus, 


f(X o) 


f(x o + 0)+ f (Xo — 0) 
2 


(30) 


la discontinuité est dite régulière. 

— Si l’une des deux valeurs (ou les deux 
valeurs) f(x 0 - 0) et f(x 0 + 0) est (ou sont) infinie(s), on 
dit que x 0 est une discontinuité de deuxième espèce 
(c’est le cas de g{x) = 1/(x- 1)). 


Fonctions numériques usuelles. 

Nous présenterons ici quelques fonctions très usuel¬ 
les en analyse, et enseignées pour la plupart aux 
collégiens et aux lycéens. Nous ne justifierons pas les 
résultats proposés concernant la croissance, les extré- 
mums (maximums et minimums) et l’allure des cour¬ 
bes. Signalons toutefois que ces particularités peuvent 
être découvertes — pour les fonctions en cause — sans 
utiliser les dérivées, sauf dans quelques cas que nous 
préciserons. 

Fonctions rationnelles. 

Ce sont des fonctions qui se calculent à l’aide des 
opérations « + », « — », « x » et « : ». Comme on l’a dit 
p. 110, elles sont continues pour tout x G IR, à 
l’exception des valeurs de x qui annulent d’éventuels 
dénominateurs. 

• Fonction linéaire (= affine = du premier 
degré). Sous sa forme générale elle s’écrit : 

y = ax + b, (1) 





Il est toujours satisfai- 3 
sant pour l’esprit de 
constater que la réalité 
concrétise parfois ses 
rêves et ses abstractions. 
Voici quelques exemples 

de spirales naturelles. 

1. Double circonvolution 
en spirale d’un cœur de 
Tournesol. Les fleurons du 
cœur sont disposés de 
façon à dessiner deux 
ensembles de spirales aux 
sens giratoires contraires. 

2. Une Ammonite. 

3. Coupe de la partie 
interne d’un Argonaute 

(spirale logarithmique). 
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FONCTIONS USUELLES 


a et b étant des coefficients réels. C’est une fonction 
définie pour tout x G (R, croissante de - oc à + oc si a est 
positif, et décroissante dans le cas contraire. Elle est 
représentée graphiquement par une droite qui coupe 
l’axe des x au point d’abscisse - b/a et l’axe des y au 
point d’ordonnée b. Le coefficient a est le coefficient 
angulaire ou pente de la droite, comme on l’a expliqué 
en géométrie analytique. 

• Fonction trinôme. C’est la fonction du second 
degré : 

y = ax 2 + bx + c. (2) 

Cette fonction, continue pour tout x G (R, possède un 
minimum si a est positif et un maximum si a est 
négatif, pour la valeur a = — b/2 a de la variable. Ce 
maximum/minimum a pour valeur 


La courbe représentative est une parabole (voir 
figure) dont le sommet a pour coordonnées (a, /3) et 
dont la concavité est tournée vers le haut pour a > 0 et 
vers le bas pour a < 0. En faisant le changement d’axes 
défini par : 

r X = x - a , (4) 

\Y = y-, 8, 

la fonction se met sous la forme Y = aX 2 . 



Graphique de différentes fonctions classiques. 

En noir : fonction linéaire y = x + 5. En orange ; y = x 2 
(cas particulier de la fonction trinôme 

y = ax 2 + bx+ c, pour a = 1 et b = c = 0). En bleu : 

y = sin x (voir texte). 


• Fonction y= 1/x. Cette fonction est définie 
pour tout x G IR, sauf pour x = 0, qui annule son 
dénominateur. Elle est constamment décroissante et 
tend vers 0 quand x tend vers ±°°. Établissons un 
tableau de variation de la fonction, en marquant par un 
double trait vertical la discontinuité (à droite et à 
gauche) x = 0. 


X 

— ex 

0 

+ 00 

1 

0 

— oc 

+ oo 

N» 0 


1 - Lorsque x varie de - <* à 0, la fonction varie 
de 0 à - oo (décroissante); quand x—y—> 0, et 
quand x—>0, y—» - 00 ; 

2 - pour x = 0, il y a discontinuité ; 

3 - quand x->0en restant positif, y —► + oc, puis 
décroît de + oc à 0 quand x varie de 0 à + oc. 

La courbe représentative est composée de deux 
« branches » : l’une dans l’angle x' Oy' (non figurée 
ici), l’autre dans l’angle xOy ; les deux branches sont 
symétriques par rapport à l’origine. Étudions la bran¬ 


che correspondant à x > 0. Les points représentatifs 
de y = 1 /x se rapprochent de plus en plus de l’axe Oy 
quand x tend vers 0, et s’éloignent en même temps de 
plus en plus vers le haut. L’axe Oy est donc une droite 
remarquable pour la courbe représentant y = 1/x, car 
cette courbe s’en rapproche indéfiniment sans jamais 
la rencontrer (si elle la rencontrait, on aurait x = 0, ce 
qui est impossible, puisque 1/x n’a pas de signification 
pour x = 0) ; on dit que la droite Oy est asymptote à la 
courbe y= 1/x en grec, sumptôsis = « rencontre » ; a- 
est le préfixe privatif : d’où asymptote = « qui ne ren¬ 
contre pas ». 

De même, quand x devient aussi grand que l’on veut 
(x —► + oc), la valeur de y = 1 /x devient de plus en plus 
petite et la courbe se rapproche indéfiniment de 
l’axe Ox sans le couper : Ox est aussi asymptote à la 
courbe y = 1/x. 



Q'" N'", ... de la courbe aux axes Ox et Oy deviennent 
de plus en plus petites sans jamais s’annuler : Ox et 
Oy sont dits asymptotes à la courbe y = 1/x. 


Fonctions circulaires, fonction logarithme, 
exponentielle. 

• Fonctions circulaires. Voir leur définition p. 90 
et leur étude ci-après, p. 117. 

• Fonction logarithme. Considérons la fonction 
y= i/x pour x > 0, et l’aire S comprise entre la 
courbe, l’axe des x, l’ordonnée fixe aA et l’ordonnée 


L’aire S est une fonction de x appelée logarithme 
népérien de x : S = In x. Elle s’annule pour x = 1, elle 
est positive pour x >1 (en foncé) et négative pour 
x < 1 (en clair). 



variable mM. Posons Om = x et convenons de poser 
S > 0 pour x > 1 et S < 0 pour x < 1. L’aire S est une 
fonction de x, qui est nulle pour x = 1 {mM confondu 
avec aA), on l’appelle logarithme népérien de x et on la 
désigne par In x, ou log e x, ou parfois Lx (la première 
notation est recommandée). 

Lorsque Neper (= John Napier) inventa les 
« logarithmes » en 1614, il était loin de penser qu’ils 
devaient avoir une aussi belle destinée. Son but était de 
simplifier les calculs trigonométriques, et il y est 
d’ailleurs parvenu, et le mot logarithme qu’il forgea 
alors signifie, d’après son étymologie : « nombre du 
rapport », le rapport en question étant ici le sinus de 
l’arc x. Ce n’est qu’au XVIII e siècle qu’on y vit une 
fonction d’un nombre x positif quelconque, calculée, 
d’ailleurs, d’une manière différente que par Neper et la 
définition de la fonction logarithme népérien a été 
donnée par Lacroix en 1797. 

• Le nombre e et la fonction exponentielle 
y = e x . La fonction logarithme sera étudiée ci-après, 
p. 116 ; elle va nous servir à introduire un nombre très 
important en analyse, le nombre e. C’est la valeur de x 
pour laquelle In x = 1. On écrira donc : 

In e = 1 . (5) 

Il est facile d’estimer, sur un graphique, une valeur 
approchée de e : on voit immédiatement que e est 
compris entre 2 et 3. Page 109, nous avons expliqué 
que e était la limite du binôme (1 + 1/n) n quand 
n —» oo ; page 153, nous donnons une méthode de 
calcul de e. 

La fonction y = e x est appelée fonction exponen¬ 
tielle ; on l’écrit aussi : 

y = exp x . (6) 

Sa variation est étudiée ci-après, p. 117. Il est bon 
de noter que la fonction logarithme népérien et expo¬ 
nentielle sont inverses ; en effet on montre que : 

y=lnx»x = e y . (7) 



point E, d’abscisse e, doit être tel que : 

aire (aeEA) = 1 = aire (abBA). 

Il faut donc déterminer E tel que l’aire beED soit égale 
à l’aire du triangle mixtiligne ABD. E est évidemment 
compris entre 2 et 3, et, en faisant un graphique 
soigné, on constaterait qu’il est compris entre 2,5 et 3. 


• Fonctions périodiques. S’il existe un nombre 
P tel que f(x + P) = f{x), P / 0, la fonction est dite 
périodique, de période P. Par exemple, la fonction 
y = sin x est périodique (voir p. 90) car on a ; 

sin x = sin (x 4- 2 tt) = 

= sin (x + 4 tt) = ••• = sin (x -F 2 kir). 

On voit que, s’il existe une période P, il en existe une 
infinité (2 P,...). On convient de nommer période de 
f{x) la plus petite valeur strictement positive de P si elle 
existe. Pour y=sin x, la période est donc 2 tt. 

C’est d’ailleurs une caractéristique des fonctions 
circulaires que d’être périodiques ; on a, en effet, 
cos x = cos (x + 2 kir) : y = cos x est périodique de 
période 2 tt ; 
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tan x = tan (x + k^) : y = tan x est périodique de 
période ir ; 

cot x = cot (x + kTr) : y = cot x est périodique de 
période tt. 

Considérons le graphique de y = sin x ; il se déduit 
facilement de celui de y = sin x pour x G [0, 2 77], puis¬ 
que f(x + 2 tt) = f(x). Un point M, de coordonnées 
(x, sin x) et un point M' de coordonnées [X + 2-7T, 
sin (x+2tt)] définissent un vecteur MM = T de 
composantes (2 tt, 0) : le graphique complet de 
y=sinx s’obtient par translations successives Tou 
- T. 



Périodicité d’une fonction. 


Fonction en escalier. 

Soit la fonction y = E(x), pour x > 0, E(x) désignant 
la partie entière (non décimale) d’un réel x. 

Par exemple x = 1/2 = 0,5 a pour partie entière 0 ; il 
en est de même de tous les réels positifs inférieurs à 1. 
Par contre, pour xs^l, chaque nombre a une partie 
entière non nulle, qui est : 

1 pour 1 < x < 2, 2 pour 2 x < 3, ... n (entier) pour 
n ^ x < n + 1. 

Autrement dit, dans les intervalles [1,2[, [2,3[, ... 
[n, n + 1 [, E(x) reste constant et égal à 1,2, ... n. On a 
évidemment, pour x tendant vers n avec x > n, 
lim E(x) = n. 

Le graphique de cette fonction est caractéristique : 
pour x compris entre 1 et 2, E(x) = C te = 1 ; la fonction 
est représentée par un segment parallèle à l’axe Ox ; il 
y a une discontinuité à gauche de 2 (non représentable 
sur le graphique), et la fonction saute de f( 2 - 0) à 
f( 2 + 0), le saut étant égal à 

f(2 + 0) — f(2 — 0) = 2 — 1 = 1 ; 

et ainsi de suite. Une telle fonction est dite, eu égard à 
son graphique, une fonction en escalier. 


y 



I I y= E(x), x > 0 

3-,_I 


2 


0 1 2 3 4 5 


Fonction en escalier y = E(x). 

La valeur de y est constante et égale à 1 pour 
xŒ[1,2[ ; constante et égale à 2 pour x El[2, 3[ ; etc. 


Dérivées. 

Généralités. 

L’invention des dérivées est un moment très impor¬ 
tant dans l’histoire des mathématiques. Cette notion 
s’est en effet révélée comme l’instrument de base de la 
théorie des fonctions. Avant de la définir avec rigueur, 
voyons comment elle se présente intuitivement. 

A l’origine de la notion de dérivée, il y a deux idées 
essentielles : 

1 - une grandeur peut être considérée comme la 


« somme » à l’infini de grandeurs infiniment petites qui 
la composent et qu’on peut isoler « par la pensée >> (les 
guillemets sont nécessaires, car cette idée est loin 
d’être exacte : il lui manque, pour cela, d’être exprimée 
dans les termes de la théorie des limites) ; 

2 - le rapport de deux grandeurs qui deviennent 
infiniment petites peut être un rapport fini ; par exem¬ 
ple si nous peignons les deux moitiés d’une règle en 
vert et l’autre en rouge, le rapport : 

longueur verte 
longueur rouge 

est égal à 1 ; si la règle s’éloigne, les longueurs rouges 
et vertes nous paraissent de plus en plus petites, mais 
leur rapport est toujours égal à 1. 

• Un problème de mécanique. Newton s’est 
posé le problème mécanique de définir la vitesse d’un 
mobile, qui peut être résolu comme ci-dessous. 

1 - Appelons x 1 le chemin parcouru au bout du 
temps f 1t et x 2 le chemin parcouru au bout du temps t 2 
par un point matériel en mouvement. Sa vitesse 
moyenne entre les instants L, et t 2 a pour valeur : 

X 2 -X! 

Vmoyenne . . \ U 

1 2 1 1 


Si nous admettons que l’espace x parcouru est une 
fonction du temps t, fonction que nous pouvons 
écrire : 

x=f(t), (2) 

alors nous appellerons x 2 —x 1 l 'accroissement Ax de 
la fonction (lire: « delta x» ou «accroissement de 
x », ou « delta de x » ; A n’est pas un nombre, mais un 
symbole d’accroissement) et t 2 — t : l’accroissement Af 
de la variable. Donc : 

Ax 

V moyenne » . - \'^) 


2 - En général, la vitesse d’un mobile n’est pas 
constante : elle peut augmenter ou diminuer à chaque 
instant. La vitesse moyenne n’est donc pas une infor¬ 
mation suffisante, et nous avons besoin de connaître la 
vitesse instantanée à un instant t par exemple. Pour 
cela, nous allons supposer que la variable t est 
« encadrée » par les valeurs t A et t 2 ; lorsque l’inter¬ 
valle A t = t 2 - f 1 devient de plus en plus petit, il en est 
de même pour Ax = x 2 -x 1 , et la vitesse moyenne 
calculée est une approximation de plus en plus exacte 
de la vitesse instantanée. 

3 - Opérons maintenant un « passage à la 
limite », qui est un raisonnement purement mathémati¬ 
que : la vitesse instantanée v au temps t est la limite, 
quand At tend vers 0, du rapport Ax/A t : 


v 


i Ax 

hm —. 

Af — 0 A t 


(4) 


Bien entendu, une équation telle que (4) exige de 
nombreuses précautions logiques (définition d’une 
direction S = At —» 0, etc. ; voir p. 108). 

4 - La limite v est elle-même une fonction de t ; 
on dit qu’elle dérive de la fonction x = f(t), ou encore 
qu’elle est la dérivée de cette fonction. Cent ans 
environ après Newton, Lagrange introduira la nota¬ 
tion : 


v= x’ = f’(t ), (5) 

en mettant l’accent « prime » sur une fonction pour 
désigner sa dérivée. 

I • Un exemple géométrique. On peut aussi arri¬ 
ver à la notion de dérivée par le problème des tangen¬ 
tes, qui a été l’objet des travaux de Descartes, Fermât, 
Pascal, Roberval et Leibniz au XVII e siècle. 

Le lecteur connaît — par intuition — la notion de 
tangente à un cercle : une droite qui ne touche le 
cercle qu’en un point ; pour tracer la tangente en A 0 à 
un cercle, on mène la perpendiculaire en A 0 au rayon 
de ce cercle qui aboutit en ce point. Mais, s’il s’agit 
d’une autre courbe que le cercle, la construction n’est 
pas aussi simple et, de plus, elle est différente pour 
chaque courbe considérée. 

Pour résoudre le problème d’une façon générale, 
rapportons la courbe C à son équation y = f(x) dans 
un système d’axes orthonormé et soit une sécante 
MM a de cette courbe, les points M(x, y) et /W^x-,, y.,) 
étant voisins. La pente de cette droite, c’est-à-dire la 
tangente de l’angle a qu’elle fait avec l’axe des x, est : 


tan a 


KM i y ! — y 
KM = x,- x 


Ay 

Ax 


(6) 


(Ay signifiant : « différence entre y 1 et y »). 

Quand M 1 tend vers M, la sécante MM 1 tend (si la 
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nature de la courbe le permet) vers une position limite 
MT, qui est la tangente à la courbe au point M. La pente 
de cette tangente, soit tan 0, est la limite de tan a 
quand x 1 tend vers x, c’est-à-dire que : 

Ay 

tan 0 = limite de—E (7) 

AX-O Ax 

Il est clair que, lorsque x 1 tend vers x (Ax—>0), y 1 
tend vers y (Ay—»0). Appelons dx et dy les grandeurs 
Ax et Ay quand elles tendent vers 0 ; nous écrirons : 

tan 0 = limite de ^ . (8) 

ax —► o Ax dx 

Or, ici aussi, bien que dx et dy deviennent infiniment 
petits, leur rapport est appréciable ; sa valeur, que 
nous désignerons par y', dépend de x : c’est une 
fonction f de x, qui peut se calculer à partir de f(x) ; on 
l’appelle la dérivée de f(x) et l’on écrit : 

Ÿ = f\*) • (9) 

(La notation dy/dx a été introduite par Leibniz.) 



Détermination de la tangente en un point d’une 
courbe par sa pente tan 6. 


Définition. 

pius généralement, considérons une fonction réelle 
y= f(x) définie dans un intervalle ]a, b[. Soit x 0 un 
nombre compris entre a et b, et h un accroissement de 
la variable qui la change en x 0 + h ; x 0 + h étant aussi 
compris entre a et b. La fonction passe de la valeur 
f(x 0 ) à f(x 0 + h). Écrivons le rapport : 

f (x 0 + h ) - f(x p) 


Lorsque ce rapport possède une limite finie pour 
b—>0, nous disons que la fonction f(x) est dérivable 
pour x = x 0 et nous écrivons : 


lim f(y ° + M" f (*°) 

h -.0 h 


f(X o). 


( 11 ) 


Le nombre f'(x 0 ) est la dérivée de la fonction f(x) 
pour x = x 0 . Nous allons approfondir cette définition. 

• Dérivée de f(x) pour x = x 0 . Représentons les 
réels par une droite infinie sur laquelle on figure x 0 ; la 
définition de la dérivée au point x 0 suppose que la 
fonction f(x) est définie sur un voisinage de x 0 (en 
grisé sur la figure de la page suivante) : ce voisinage 
contient donc un intervalle /auquel appartient x 0 et sur 
lequel f(x) est définie (/est en gris foncé sur la figure). 
Dans / (dont les limites ne nous intéressent pas) on 
peut donc considérer deux intervalles ouverts 
] x 0 — a, x 0 [ et ] x 0 , x 0 + a[ (« ouverts » veut dire que 
x 0 , x 0 — a et x 0 + a, appartenant tous trois à /, n’appar¬ 
tiennent pas aux deux intervalles considérés). Nous 
avons entouré d’un petit cercle x 0 , x 0 -aetx 0 + apour 
souligner qu’ils n’appartiennent pas à ces deux inter¬ 
valles disjoints. 

La réunion de ces deux intervalles est un ensemble 
que nous noterons 0(x o , a). Dire que L existe, c’est dire 
qu’on peut choisir a de façon que, pour tout x ^ 
appartenant à Ü(x 0 , a), la différence (en valeur absolue) 

f(X,)~ f(Xg) L 

Xi — Xo ' ’ 
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soit inférieure à tout e > 0 fixé, ce qui s’écrit symboli¬ 
quement : 3 L si V e > 0, 3 a tel que 


f (*i) - f(x o) 

X! - x 0 



<e, Vxi£0(x o ,a). 


(13) 


La condition Vx 1 GÜ(x 0 , a) est capitale : elle précise 
que la dérivée est une limite dont on s’approche aussi 
près qu’on veut, x ^ restant constamment différent de 

x 0 . 

Le lecteur pensera peut-être que ces précisions sont 
des subtilités byzantines et bien des collégiens se 
contentent de la définition classique y' = limAy/Ax 
quand Ax —> 0, sans se poser ces problèmes. Or consi¬ 
dérons un instant la fonction y = x 2 et demandons- 
nous quelle est la valeur de y' au point x 0 = 1 par 
exemple. Appelons x 1 un nombre très voisin de x 0 et 
écrivons : 

y' = L = lim ■ —* ——quand X! —> x 0 . (14) 

Xi — Xo 

Or on a : 

f(Xi)-f(x 0 ) x?-x 2 o 

Xi-Xo X i — X 0 

(x 1 -x 0 )(x 1 + Xo) 

Xi - Xo 


(15) 

=X 1 +Xo, 


avec 

lim(x 1 -i-x 0 ) quand x 0 ->x 1 =2x 0 . (16) 

On écrit donc y' = 2 x 0 ; mais, si l’on ne précise pas, 
ce résultat est en contradiction avec la condition 
x, / x 0 : comment peut-on avoir à la fois, en effet : 
x 1 + x 0 = 2 x 0 et x^Xq? Cette contradiction dispa¬ 
raît si l’on précise que y' = 2 x 0 est une limite (qui ne 
sera jamais atteinte) vers laquelle tend x 1 + x 0 quand x., 
devient aussi proche que l’on veut de x 0 . 

Seule la définition rigoureuse ci-dessus nous met à 
l’abri d’une contradiction éventuelle : la notion de 
dérivée, qui est l’un des fondements de l’analyse, 
méritait bien une telle rigueur. 


]x p - a, x 0 [ ]x 0 , x 0 + a[ I 

J —@-@-L 


voisinage de x n 


Dérivée de f(x) pour x = x 0 . 


• Dérivée sur un intervalle. 

A partir de la définition de la dérivée de f(x) en un 
point x 0 , et que l’on note indifféremment f x (x 0 ) ou 
y;(x 0 ), en mettant x en indice pour préciser qu’il s’agit 
de la variable , on définit la dérivée à droite d’une 
fonction f{x) pour x= x 0 lorsque h = x 1 - x 0 tend vers 
zéro par valeurs positives (x 1 > x 0 ), et la dérivée à 
gauche dans le cas contraire. 

Si une fonction admet, en tout point d’un 
intervalle ] a, b[, une dérivée, elle est dite dérivable sur 
l’intervalle considéré et l’on démontre que cette pro¬ 
priété entraîne sa continuité sur ]a, b[. Mais ce dernier 
théorème n’a pas de réciproque : Weierstrass a montré 
qu’on pouvait construire des fonctions continues en 
tous les points d’un intervalle ] a, b[ et n’admettant une 
dérivée en aucun point de cet intervalle. On a donc, 
dans un sens seulement : 

fonction dérivable fonction continue 

sur ]a, b[ ^ sur ]a, b[, (17) 

et on ne peut inverser l’implication. 


Calcul des dérivées. 

• Formules de dérivation. En appliquant la défi¬ 
nition précédente à une fonction quelconque y = f(x), 
en effectuant les calculs et en déterminant la limite du 
rapport Ay/Ax quand Ax —» 0, on peut calculer directe¬ 
ment la dérivée d’une fonction. Des formules générales 
ont été établies, qui simplifient les calculs dans les cas 
les plus usuels. 


1 - Une fonction constante y = f(x) = C a une 
dérivée nulle y' = 0. 

2 - La fonction y = x a pour dérivée y' = 1. 

3 - La fonction y = x n a pour dérivée y' = nx n1 
(n entier ou fractionnaire). 

4 - Le monôme y = ax n a pour dérivée 

y' = anx 0-1 . 

5 - Soit u et v deux fonctions définies et dériva¬ 
bles de x dans l’intervalle considéré. On démontre les 
formules suivantes, en appelant u' et v' les dérivées de 
u et de v : 


y = u + v ; 

y ' = u ' + v ' ; 

y = uv ; 

y ' = u ' v + v ' u 

u 

y= V’ 

, u ' v — v' u 
y = v 2 

y =Vü\ 

u ' 

y ' =-= ; 

2 Vu 

C 

II 

y ' = nu n 1 u'. 


6-11 résulte des formules (18) que la fonction 
polynôme y = a 0 x n + + a n a pour dérivée 

y' = na 0 x n 1 + ••• + a n _ 1 . 

Exemple: y = x 3 + 2 x 2 - 1 a pour dérivée 

y' = 3 x 2 + 4 x. 

7 - Les fonctions circulaires, logarithmiques et 
exponentielles ont des dérivées indiquées sur le 
tableau ci-après. On notera que la dérivée de la 
fonction y = e x est y' = e x , c’est-à-dire la fonction 
elle-même. 



Fonction y Dérivée y' 



• Théorème des fonctions composées. Consi¬ 
dérons la fonction composée 

y = f[u(x)]. (19) 

Si u(x) est dérivable pour x = x 0 et si la fonction f(u) 
est définie dans un intervalle intéressant le point 
u 0 = u{x 0 ) et dérivable pour u = u 0 , alors la fonction y 
est dérivable pour x = x 0 et sa dérivée a pour valeur : 

/(Xq) = f'(u 0 ) u'(Xq) . (20) 

Exemple : soit la fonction : 

y = \ / 2x 2 + x + 1 = (2 x 2 + x + 1 ) 1/3 . (21) 

Posons u = 2 x 2 + x + 1, d’où y = u y3 . Alors : 

u '(x ) = 4 x 4-1 ; f'(u) = | u 2/3 (22) 

D’où, d’après (20) : 


Cari Jacobi (1804-1851), mathématicien allemand : 
il a étudié, en même temps qu’Abel, la théorie des 
fonctions elliptiques, et introduit en analyse les 
fonctions dites « fonctions 0 » ; on lui doit aussi la 
théorie des déterminants fonctionnels (jacobiens). 

D’où : 

f(x) = a x lna, (28) 

c’est-à-dire la formule du tableau n° 7. 

• Exemples. Le calcul des dérivées est relative¬ 
ment « automatique », du moins quand il s’agit de 
fonctions usuelles, grâce aux formules précédentes. La 
seule difficulté éventuelle est la complexité et la 
longueur des calculs ; dans les cas de fonctions 
exponentielles, il est nécessaire de calculer sur les 
fonctions inverses en « passant en logarithmes », selon 
les règles du calcul logarithmique. En particulier, le 
logarithme de a u est uln a, et le nombre In a est un 
coefficient et non une grandeur variable, donc il doit 
être traité comme tel. 

— 1 er exemple : y = A sin cot (cette fonction cir¬ 
culaire de la variable t est très importante en physique 
ondulatoire). C’est une fonction composée de la forme 
y = A sin u avec u = cot ; on a : 

f'(u) = A cos u ; u'(t) = co (29) 

d’où, d’après (20) : 

y' = f'(t) u'(t) = Aco cos cot. (30) 

— 2 e exemple : y = In (x 2 - 1). Cette fonction 
est une fonction composée y = In u, avec u = x 2 - 1. 
On a : 

nu) = 4 ; u (x) = 2 x , (31) 


y' = -(2 x 2 + x +1) 2/3 (4 x + 1), 


soit, puisque u 


Vu 2 


y = 


4 x + 1 


3 V(2x 2 + x +1) 2 


(23) 


(24) 


• Dérivée d’une fonction inverse. Soit y = f(x) et 
x = <p(y) deux fonctions inverses : on montre que, si les 
conditions de dérivabilité et de continuité sont satis¬ 
faites : 


<p'(y) 


1 

f\*Y 


(25) 


L’application la plus usuelle de ce résultat concerne la 
fonction y = a x , inverse de la fonction : 

x=, p(y) = !H’ < 26 > 

In a 

comme on l’explique p. 112. Pour calculer la dérivée 
y' de la fonction a x , on utilise la relation (25), en 
notant que, d’après le tableau du n° 7 ci-dessus, on a : 


<p'(y) 


1 

x In a ' 


(27) 


d’où : 



(32) 


La fonction u'/u est appelée dérivée logarithmique 
de la fonction u. 

— 3 e exemple : y = • La présence d’une 

exponentielle nous incite à « passer en logarithmes », 
soit : 

In y = ax In ( ~ • (33) 


Dérivons les membres séparément. A gauche, on 
obtient la dérivée logarithmique de y, soit y'/y ; à 
droite, on a le produit uv de deux fonctions u = ax et 
v= In (x/a), dont les dérivées sont u’ = a et v' = 1/x 
voir le tableau du n° 7 ci-dessus; ici A = 1/a). 
La dérivée (uv)' de ce produit est u' v + v'u (n° 5 
ci-dessus), d’où finalement : 



In 



1 

+ ax — 
x 


= a In 



+ a 


= a 


h 



-t -1 


(34) 
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On en tire : 

y' 


ay 



= a 



h (?)-]■ 


(35) 


Dérivées successives. 

Pour étudier le comportement d’une fonction conti¬ 
nue y = f(x) dans un intervalle, on se sert, avant toutes 
choses, de sa dérivée (voir ci-après p. 153). Mais il est 
utile aussi d’utiliser, si elles existent, la dérivée de la 
dérivée, la dérivée de la dérivée de la dérivée, etc. qui 
sont appelées dérivées seconde ou d’ordre 2, d’ordre 
3, ..., d’ordre n. 

Si donc une fonction numérique y = f(x) admet la 
dérivée y' = f(x) dans l’intervalle [a, b] ou ]a, b[, et si 
la fonction y' est dérivable dans cet intervalle, nous 
l’appelons dérivée seconde et nous la notons 

y" = r(x) . (36) 


Extrémums. 

I - La fonction est maxi¬ 
male pour x = c ; f(x) est 
donc croissante pour x < c 
et décroissante pour x> c, 
autrement dit, on a 

f'(c J > 0 et f'(c+) < 0. 

II - f(c) est un minimum ; 
f(x) est donc décroissante 
pour x < c et croissante 
pour x > c, soit f'(C-) < 0 et 

f'(cj > 0. 

Dans les deux cas f'(c. ) et 
f (c,) sont de signes contrai¬ 
res, donc leur produit est 
bien négatif. 



Les dérivées successives, si elles existent, sont 
notées f (n) {x) : la dérivée de f"(x) est f< 3) (x), etc. La 
fonction elle-même est sa propre dérivée d’ordre zéro : 
f{x) = f°\x). 

Exemple : soit y = In x ; on a, en appliquant les 
règles du calcul des dérivées : 


y' = 


x 



(-1) n 1 



On notera que si y = e x , on a : 

y = y' = y" = ••• = y( n > = e x . 


(37) 

(38) 


Application des dérivées. 

Appliquées à l’étude des courbes y= f(x), les déri¬ 
vées nous donnent de nombreuses informations sur 
leurs propriétés (tangentes, normales, points remar¬ 
quables, etc.). L’application la plus connue concerne la 
détermination des tangentes à une courbe : en un 
point (x 0 , y 0 ) d’une courbe y = f(x), la dérivée 
yo = f'{x 0 ) est égale à la pente de la tangente à la 
courbe en ce point. Nous allons examiner ici l’apport 
fondamental de la théorie des dérivées à la théorie des 
fonctions, qui se résume à ceci : 

— deux théorèmes garantissant l’existence 
d’une tangente satisfaisant à certaines conditions pour 
un point C d’abscisse c comprise à l’intérieur de 
l’intervalle [a, b] où l’on étudie la fonction y = f(x ) ; 

— des formules permettant de calculer la valeur 
d’une fonction en la considérant comme une série 
numérique, c’est-à-dire comme une somme de termes 
dont elle est la limite ; 

— des règles pour étudier le sens de variation, 
les extrémums et certains points singuliers des fonc¬ 
tions. 


• Le théorème de Roi le. Il garantit l’existence 
d’une tangente parallèle à l’axe des x pour un point C 
compris entre deux points A et B d’une courbe repré¬ 
sentant la fonction y = f(x), sous certaines conditions ; 
en voici l’énoncé : 

Si f(x) est une fonction définie et continue sur un 
intervalle [a, b], si elle admet une dérivée sur ] a, b[, et 
si f(a) = f(b), alors il existe au moins un point c de 
]a, b[ tel que f'(c) = 0. (Voir figure ci-dessous.) 

(Comme la dérivée exprime la pente de la tangente, 
le fait qu’elle soit nulle signifie que la tangente est 
parallèle à l’axe des x.) 


• Théorème des accroissements finis (appelé 
aussi théorème de la moyenne). Il garantit l’existence 
d’une tangente parallèle à une corde AB de la courbe 
représentant la fonction y = f(x), en un point C situé 
entre A et B, sous certaines conditions : 

Si f{x) est définie et continue sur [a, b] et si elle 
admet une dérivée f'{x) sur ]a, b[, alors il existe au 
moins une valeur c comprise entre a et b pour laquelle 
on ait : 

f(b) ~ f(a) = {b - a) f\c) , (39) 

avec a < c < b. 

Ce théorème peut s’écrire différemment, en posant 

b = a + h (b : accroissement fini de a) et en posant 

c = a + Oh (0 < 6 < 1 ), donc Oh < h et a < c < b) : 

f(a + h) - f(a) = hf'{a + Oh) ; (40) 

ou 

f(a + h) = f(a) + hf\a + Oh) . (41) 



Théorème des accroissements finis. La pente 


de AB est 


f(b) ~ f(a) . 


la pente de la tangente en C 


b - a 

est tan 6 = f (c) ; le théorème exprime que l’égalité 
— f/ c \ — ou AB parallèle à CT — est vérifiée 

b - a 

pour au moins un point entre A et B si f(x) est définie, 
continue et dérivable sur l’intervalle considéré. 



Le théorème de Rolle. 

I - La fonction f(x) admet 
une dérivée sur ]a, b[ ; pour 

x = c, on a f'(c) = 0. 

II - La fonction f(x) 
n’admet pas toujours une 
dérivée sur ]a, b[: il 
n’existe aucun point C entre 
A et B où la tangente soit 

parallèle à l’axe des x. 


• Formules de Taylor et de MacLaurin. Si f{x) 
admet des dérivées continues d’ordre 1, 2, 3, ..., n sur 
[a, b] et une dérivée d’ordre n+ 1 sur ]a, b[, on peut 
écrire la formule suivante, dite formule de Taylor: 


f (b) = f (a) + (b - a ) f'(a ) + ( * f"(a) + - 


(b - a )" 

1 x 2 x ••• x n 
(b - a) 1 


f (n \a) 


1 x 2 x ••• x n x (n + 1) 


f (n+ '\c), (42) 


avec a < c < b. 

Si l’on pose, comme pour le théorème des accroisse¬ 
ments finis, b = a + h, la formule de Taylor s’écrit, en 
utilisant la notation n! = 1 x2x3x-xn (facto¬ 
rielle n) : 


h 2 

f(a + h)= f{a)+ hf'(a) + — f"(a) + 

h (n +1) 

+ _- (n+1 

(n +1)! 


" + Tï f,, » + 

\a + 0h), (43) 


avec 0 < 0 < 1. 

Dans le cas où 0E[a, b], pour tout x tel que 
a < x < b, la formule de Taylor est dite formule de 
MacLaurin ; elle s’écrit : 


f (x ) = f (0) + xf'(0) + JJ f "(0) + • ■■ ■• + ~ f' >(0) - 


(n +1)! 


f {n+ '\0x). (44) 


(Voir, p. 153, les applications les plus usuelles du 
théorème des accroissements finis et des formules de 
Taylor et de MacLaurin.) 


• Variation des fonctions. Nous avons vu, 
p. 106, que l’un des problèmes les plus importants 
relatif à la variation d’une fonction concerne le sens de 
variation de la fonction sur un intervalle [a, b]. Cette 
étude est facilitée par le théorème suivant, qui sera 
utilisé plus loin (p. 118) : 

Si f(x) est dérivable pour tout x G [a, b], f(x) est : 

— constante sur [a, b] si, quel que soit 
x G [a, b], f'{x) = 0; 

— croissante sur [a, b] si, quel que' soit 
x G [a, b], f'(x)> 0; 

— décroissante sur [a, b] si, quel que soit 
x G [a, b], f'(x) < 0. 


• Extrémums. Nous avons défini plus haut ce 
qu’il fallait entendre par maximums et minimums 
d’une fonction ; on appelle encore extrémums ces 
valeurs particulières de la fonction. Soit [a, b] un 
intervalle sur lequel f(x) est définie, continue et dériva¬ 
ble et c un nombre tel que a < c< b ; si c est un 
extrémum, on démontre que f'(c) = 0. Cet important 
théorème est commenté sur la figure du haut de la 
page. 


• Points remarquables de la fonction y = f(x). 

— Lorsque la dérivée y' s’annule en changeant 
de signe pour la valeur x 0 de la variable, le point 
(x 0 , y 0 ) est un extrémum (maximum ou minimum). 

— Le signe de la dérivée seconde y" permet de 
caractériser le sens de la concavité de la courbe : 
tournée vers le haut pour y" > 0, vers le bas pour y" < 0. 
Lorsque y" s’annule en changeant de signe pour 
x = x 0 , le point (x 0 , y 0 ) est un point d’inflexion : c’est le 
point où la concavité de la courbe change de sens (voir 
ci-après l’exemple y= x 3 ). 

Voir aussi p. 153 les variations de fonctions. 
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Fonctions usuelles 
de variables réelles. 

Méthode d'étude. 


Étant donné une fonction y — f(x), l’étude de cette 
fonction comprend les opérations suivantes : 

1 - Déterminer les intervalles de définition, les 
discontinuités et, éventuellement, la périodicité de la 
fonction. 

2 - Calculer sa dérivée première y' = dy/dx 
dans les intervalles de définition, ainsi que sa dérivée 
seconde y" = d 2 y/dx 2 . 

3 - Étudier le signe de y' et de y" dans les 
intervalles de définition. 

— Lorsque y' est plus grand que 0, la fonction 
est croissante ; lorsque y' est plus petit que 0, la 
fonction est décroissante ; lorsque y' = 0, la fonction 
est constante. 

— Pour déterminer les extrémums, il faut cher¬ 
cher les valeurs c de x qui annulent la dérivée (= zéros 
de la dérivée), telles que f(c_) et f'{c + ) soient de signes 
contraires (on dit aussi que « la dérivée s’annule en 
changeant de signe »). Soit donc f(c) = 0 ; si f"(c) < 0, 
c correspond à un maximum f(c) de la fonction ; si 
f"(c) > 0, f(c) est un minimum. Si f'\x) = 0 ou n’existe 
pas, on détermine la nature des extrémums par l’étude 
de la croissance de la fonction. 

4 - Étudier éventuellement les valeurs remar¬ 
quables de y (quand x —* ± °°, quand x —» a, si f{x) est 
discontinue pour x = a, etc.). 

5 - Construction du graphique : on trace éven¬ 
tuellement les asymptotes (voir p. 112), on détermine 
les points remarquables (extrémums, points de re¬ 
broussement, d’inflexion, etc.) et on trace le graphique 
en tenant compte des résultats obtenus précédem¬ 
ment. 


Fonction puissance. 

Elle est de la forme y = x n , n étant un nombre réel ; 
exemples : 

y = x 2 , y = x 3 , y = x 1 =, 

y = x 1/2 = Vx , etc. (1) 

• Premier exemple : y = x 3 . Définie et continue 
sur IR, cette fonction admet les dérivées successives 
y' = 3 x 2 , y" = 6 x, ÿ" = 6, y (4) = y (n>4) = 0. Il n’y a pas 
d’extrémums, car y' = 0 pour x = 0, mais f (0_) et f (0 + ) 
sont positifs, d’où f'{0_) . f (0 + ) > 0. En revanche, y" 
s’annule en changeant de signe pour x = 0 : la courbe 
a, pour x=0, un point d’inflexion. Enfin, quand 
x—► ± oo, y— > ± oo. D’où le tableau de variation : 


X 

— 00 


0 


4- oo 

V 

+ OC 

+ 

0 

+ 

4- oo 

y" 

— oc 

- 

0 

+ 

4- oo 

y 

— oc 

s 

0 


4- oc 


Ce tableau résume l’étude préliminaire ; il montre 
que y' est positivé (+) quand x varie entre — oo et 0, et 
positive quand x varie entre 0 et + oo ; que y" est 
d’abord négative, puis positive, 0 étant la valeur criti¬ 
que, et que la fonction est constamment croissante (/*) 
de - oc à 0 et de 0 à + oo, puisque y' est toujours positive 
(x = 0 n’est pas un extrémum, car y' ne change pas de 
signe en passant par 0 ; les flèches indiquant le sens 
de variation de y rendent cette constatation intuitive). 

La courbe représentative se trace immédiatement 
(en tenant compte du signe de y", qui -indique le sens 
de concavité de la courbe). 

• Deuxième exemple : y = 1/x = x -1 . Définie et 
continue sur IR, sauf pour x = 0 (1/0 n’a pas de sens) ; 
on a, en appliquant les règles du calcul des dérivées, 

- 2 1 „ 0 _ 3 2 
y '=-x =-—* et y = 2 x 3 = p. 



Courbe représentative de y = x 3 . 

Le point O (origine) est un point d’inflexion. 


La dérivée première est toujours négative et ne 
s’annule jamais, puisque x 2 est toujours positif, donc la 
fonction est constamment décroissante, sans extré¬ 
mums. Quand x—y—> (0_) et quand x—► + <», 
y—>(0 + ); quand x—»0, y—>±oo selon le signe de x. 
D’où le tableau (le double trait vertical indique que yest 
discontinue pour x—*0) : 


X 

— 00 

(0_)0(0 + ) 

y' 

— 

— 

V 

(0_) N 

— 00 

4-oo (Q + ) 


et la courbe de la figure ci-dessous. 


Graphique de y = 1/x. 

Ox et Oy sont les asymptotes de cette courbe, 
appelée hyperbole équilatère ; la courbe passe, 
notamment, par le point A(x = 1, y = 1). 



Fonction logarithme népérien. 


Page 112 nous avons défini la fonction y = In x 
comme l’aire limitée par la courbe 1/x, l’axe des x, et 
l’ordonnée variable mM et qui s’annule pour x = 1 ; 
nous avons précisé qu’elle n’était définie que pour 
x > 0. 

• Propriétés de la fonction logarithme. La pro¬ 
priété fondamentale des logarithmes s’exprime par les 
deux formules : 

In (Xt x 2 ) = In Xi 4- In x 2 ; In = In Xi — In x 2 . (2) 

On en déduit, pour tout exposant m entier ou 
fractionnaire : 


In (x m ) = m In x. (3) 

La fonction inverse de y = In x est e x . L’intérêt des 
logarithmes est de remplacer des opérations telles que 
l’élévation à la puissance m ou l’extraction d’une 
racine m-ième par des multiplications et des divisions. 
Pour déterminer le logarithme népérien d’un nombre, 
on se sert d’une table ou d’une calcula trice électroni¬ 
que. Par exemple pour calculer a = S/497, on pose : 

In a = In (^497) = ln _ ^ 97 . ( 4 ) 

Les tables donnent In 497 = 6,208 59, donc le nom¬ 
bre a cherché a pour logarithme 0,886 94. En lisant la 
table en sens inverse, on trouve : 

In 2,427 69 = 0,886 94, (5) 


donc a = 2,427 69. 

• Système de logarithmes. Étant donné un réel 
a quelconque, on appelle logarithme de x dans un 
système de base a le nombre In x/ln a ; on écrit : 

ln x 

' og ‘ x = WI (6) 


Si a = 10, le système est dit de logarithmes déci¬ 
maux. Un logarithme décimal s’écrit donc log 10 x et, 
par convention, Ig x. Les logarithmes népériens sont 
tels que In x/ln e = In x, puisque In e = 1 : ce sont des 
logarithmes de base e, qui peuvent être écrits log e x 
(toutefois la notation recommandée est In x, ce qui 
évite toute confusion). Si a= 2, le système est dit de 
logarithmes binaires ; on écrit alors log 2 x ou Ib x. 

La base d’un système de logarithmes est telle que 
log a a = 1. Ainsi : 

Ig 10 = 1 ; In e = 1 ; Ib 2 = 1 . (7) 

On passe des logarithmes népériens (utiles pour le 
calcul théorique) aux logarithmes décimaux (utilisés 
pour le calcul pratique) par la relation de définition (6), 
avec a = 10, d’où : 

Ig x = M In x, (8) 

avec M = 1/ln 10 = 0,434 294 ... 

• Variation de la fonction y = In x. La fonction 
est définie et continue pour x > 0 ; sa dérivée est, par 
définition, y' = 1/x, donc toujours positive. Il en résulte 
que y = In xest toujours croissante (pas d’extrémums), 
quand x varie de 0 à + ». Quand x—> 0, y—> — oo (avec la 
convention expliquée p. 112 pour le signe de la 
fonction In x) ; quand x—» -l- y—> + °°. 

La dérivée seconde y" = -1/x 2 est toujours néga¬ 
tive, donc la courbe tourne sa concavité vers le bas ; 
elle coupe l’axe des x au point x = 1 (car alors In 1 = 0 
par définition). Pour 

x = e = 2,718 281 ..., In x = 1 . 


Graphique de y = In x (fonction logarithme népé¬ 
rien). 
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FONCTIONS USUELLES 


Fonction exponentielle. 

C’est la fonction y = a x (a > 0), définie et continue 
sur R, de — oc à + oc. On la note aussi : 

y = a x = exp a x (9) 

(lire « exponentielle de x dans la base a »). Si a = e, la 
fonction est : 

y — e x = exp x, (10) 

et se nomme « exponentielle de x >> sans préciser la 
base e. Comme on l’a déjà dit, la fonction y=e x est 
inverse de la fonction x = In y ; la fonction inverse de 
y = a x est log a y = x. 

La dérivée, obtenue en passant par les logarithmes, 
est y' = yln a. La fonction exponentielle est donc tou¬ 
jours croissante si a > 1 (In a > 0), et toujours décrois¬ 
sante si a < 1 (In a < 0). Les valeurs de y = a x quand 
x —> ± co dépendent aussi de a : 


Courbes représentant 
y = cos x (en noir), 
y = sin x (en bleu). 

Les deux courbes se 
déduisent l’une de l’autre 
par une translation le long 
de l’axe des x, de valeur 
absolue tt/2. 



a < 1 


a > 1 


lim 

a x 

= 4- oo ; 



lim 

a x 

= 0; 

— pour y = cos x: 





0 1 ) y" = — cos x , y"' = sinx, 

..., 

lim 

a x 

= 0; 


ri l 7ü\ 




y ( 

1 = cos 1 x + n — 1. 

im 

a x 

= + 00 . 

Les formules de MacLaurin 

s’écrivent (0 < 6< 1) 


La courbe de y = a x se déduit de celle de y = log a x 
en considérant l’axe des x comme axe des ordonnées 
et celui de y comme axe des abscisses. La courbe 
représentant y = e x se déduit de même de celle repré¬ 
sentant y = In x. 


sin x = x 



x^ 

7! 


+-h 


(2 


TTT)T sin [ 


6x + (2 n + 1)- 


]■ 


(15) 


Fonctions circulaires inverses (ou réciproques). 

Considérons la fonction y = sin x, qui est continue et 
strictement croissante dans l’intervalle [- tt/2, tt/2], 
A toute valeur de y correspond un arc x, qu’on écrit : 

x = arcsin y (ly|«£l) (18) 

(lire : « arc sinus y »). 

x est la fonction circulaire réciproque ( inverse) de y, 
telle que x soit compris entre - tt/2 et -l- tt/2. 

Si l’on convient d’appeler toujours y la fonction et x 
la variable, l’écriture 

y = arcsin x, avec Ix|«s1, (19) 



Fonction y = a x pour diverses valeurs de a. Pour 
x = 0, toutes les fonctions ont la même valeur a 0 = 1. 
En traits pleins : a> 1 ; en tiretés : a < 1. 



• Variations. 

— Les fonctions y = sin x et y=cosx sont 
continues sur IR ; la relation cos x = sin (tt/2 — x) mon¬ 
tre que les courbes qui les représentent sont égales et 
se déduisent l’une de l’autre par la translation - tt/2 
parallèle à l’axe des x. Étudions par exemple y = cos x 
(entre 0 et 2 tt), soit en nous servant du cercle trigono- 
métrique, soit à l’aide de y' = - sin x : 


x 

0 

F 1 C\l 

TT 

3 T T 
~2 

2 TT 

y ' = - sin x 

0 - 

-1 

- 0 + 

+1 

+ 0 

y = cos x 

1 \ 
(max) 

0 

\l — 1 

(min) 

0 

1 

(max) 


D’où la courbe ( sinusoïde) de la figure ci-dessus : 


signifie : 1° que l’arc y a un sinus égal à x, soit 
sin y = x ; 2° que cet arc est compris entre - tt/2 et 
tt/2, 



— La fonction y = tan x est discontinue pour Variation de y = tan x étude géométrique. La 

x = tt/2, 3 tt/2, ..., (tt/2 + /ctt). On s’en aperçoit en étu- valeur de y est représentée par le segment AT (ou 
diant la variation de y = tanx à l’aide de la représenta- AT ' m 

Fonctions circulaires. tion géométrique pour x variant de — tt/2 à + tt/2 : 


Il s’agit des fonctions sin x, cos x, tan x et cot x, 
définies p. 90 ; les deux premières sont périodiques, 
de période 2 jt, les deux dernières, périodiques de 
période jt. Leurs propriétés (addition, etc.) sont résu¬ 
mées p. 148. 


• Dérivées. On démontre les formules sui¬ 
vantes : 


{ 

{ 


y = sin x; 
y' = cos x ; 

y = tan x; 

, 1 

y = —— 

cos x 


y = cos x ; 
y' = - sin x; 


1 + tan 2 x ; 


y= cot x; 

, 1 

y = — 2 

sin x 


— (1 + cot 2 x ). 


( 12 ) 


D’où les dérivées successives, 
— pour y = sin x; 


y = - sin x , y'" = - cos x , 


sin x + n—l; (13) 


1 - Quand x = -tt/2, M est en B et l’intersec- 
:ion des droites OB' et AT' est rejetée à l’infini ; donc 

^x-»=>(tan x->• - <»). (17) 

2 - Quand M ' parcourt l’arc B'A, c’est-à-djre 
pour - tt/2 < x < 0, le point T' se rapproche de_A ; AT' 
diminue en valeur absolue, mais, puisque AT' < 0, il 
croît en valeur algébrique. La fonction y = tan x est 
donc croissante jusqu’à x = 0 (tan x = 0). De même, 
quand x varie de 0 à tt/2, AT > 0 est croissant. 

3 - Quand /W —► B , x —> ^ et y = tan x —► + oo . 

4 - Pour M situé sur arc BA , la v aria tion répète 
la variation correspondant à Msur l’arc B' A ; de même 
arc A' B' correspond à arc AB. 

La courbe y = tan x est composée d’éléments dis¬ 
continus qui se déduisent les uns des autres par une 
translation de valeur absolue tt parallèlement à l’axe 
des x; les droites x= tt/2 + kir, parallèles à l’axe Oy, 
sont asymptotes à la courbe. 
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FONCTIONS DE PLUSIEURS VARIABLES 


soit (2°) 

La dérivée de cette fonction est 

y'* = (arcsinx)i = 1 ■ (21) 

VI - x 

voir aussi p. 148. 

Fonctions hyperboliques. 

On définit, en analyse, les fonctions suivantes, qui 
font intervenir le nombre e : 

e x -e~ x , e x +e" x 

shx =- - -, ch x =---, 

shx e 2x — 1 1 (22) 

thx = ïh"x = ' coth x = thT (peu usi,ée) • 


On lit : « sinus hyperbolique de x », « cosinus hyper¬ 
bolique de x », « tangente hyperbolique de x », 
« cotangente hyperbolique de x », ou, plus brièvement, 
on épèle les deux lettres qui précèdent x: «shx», 
« ch x », « th x ». Ces fonctions sont liées à Vhyperbole 
comme le sinus et le cosinus sont liés au cercle. On a 
notamment la relation importante : 

ch 2 x— sh 2 x = 1 (23) 

On définit aussi les fonctions hyperboliques récipro¬ 
ques : par exemple, y = arg sh x (lire : argument sh x) 
est équivalente à x = sh y. 

(Voir p. 154 pour l’étude des fonctions hyperboli¬ 
ques.) 


Une fonction de n variables réelles, 
y= f(x 1f x 2 , ..., x n ), 

est une application R n — 1 '—>R. 

La fonction z = f(x, y) considérée plus haut n’est 
définie que pour certains couples (x, y) seulement, 
correspondant aux points m situés dans la zone en 
grisé de la figure. L’ensemble D de ces couples est le 
domaine de définition de la fonction f ; dans l’exemple 
illustré par la figure, D est un disque de centre a et de 
rayon r, tel que am ^ r. 

• Pour étudier la continuité et les propriétés 
d’une fonction d’une variable réelle, nous avons été 
amené à définir des intervalles [a, b], ]a, b[, etc. de R 
appelés segments. Pour étudier une fonction de plu¬ 
sieurs variables réelles, nous définirons de même des 
ensembles sur R 2 , R 3 , ..., R n . Voici des exemples de tels 
domaines de définition. 

— Si les variables x 1f x 2 , ..., x n sont soumises à 
la condition : 

a 1 < x 1 < b 1 , a 2 < x 2 < b 2 , ..., a n <x n <b n , (3) 

l’ensemble des points de R n (x 1t x 2 ,..., x n ) s’appelle un 
pavé ouvert (il ne s’agit pas de points au sens géomé¬ 
trique élémentaire, mais d’éléments à n composantes ; 
voir pp. 106 et 116). 

— Si l’on doit avoir : 

a, « x, s b,. a„ =s x„ s b„ , (4) 

le domaine de définition est un pavé fermé. 
Exemples : 

1 - Dans le cas z = /(x, y), où n = 2, un pavé 
fermé est l’ensemble des points m tels que : 

a «s x b et a' y ^ b' ; (5) 

c’est un rectangle fermé de côtés égaux à ab et a' b'. 

2 - Dans le cas u = f(x, y, z), les conditions : 
a < x < b , a' < y < b ', a" < z < b" (6) 


Fonctions de plusieurs variables. 
Fonctions composées. 

Domaines de définition. Continuité. 

• Considérons une surface gauche , dont 
l’image concrète peut nous être donnée par un 
fragment de peau d’orange, ou une « calotte », et 
rapportons cette surface à un trièdre de référence 
euclidien. Un point M sur cette surface est défini par 
ses trois coordonnées x, y et z ; si la surface est 
« géométrique » (c’est-à-dire, intuitivement parlant, 
régulière), on peut trouver une relation z = f(x, y) telle 
que, à tout couple convenable (x, y) de valeurs des 
variables x et y corresponde une valeur de z, ce qui 
revient à dire qu’aux points m de coordonnées x et y 
dans le plan Oxy, appartenant à un domaine D du plan, 
on fait correspondre les points M de la surface gauche 
considérée. 



La surface gauche, en forme de cupule, est repré¬ 
sentative de la fonction de deux variables z = f(x, y). 


La fonction z = f{x, y) est une application f de R 2 
dans R : 

(x, y) —-—> z, R 2 —^R. (1) 

On peut imaginer une application de R 3 dans R, 
R 3 —R , telle que : 

u = y, z ), (2) 

faisant correspondre à tout triplet (x, y, z) de R 3 un 
nombre u de R : c’est une fonction de trois variables. 



défin issent un parallélépipède ouvert d’arêtes ab, a' b', 
a" b" : le fait qu’il soit ouvert interdit de considérer les 
valeurs x = a ou b, y = a' ou b', z = a" ou b 
c’est-à-dire les points situés sur la surface du pavé. 

— Un domaine tel que am < r, quand n = 2, est 
appelé un disque (c’est le cercle de centre a et de 
rayon r) ; si n = 3, la condition am < r imposée aux 
points de coordonnées (x, y, z) définit un domaine 
appelé sphère (ou boule). Plus généralement un 
domaine de points m tels que am < r s’appelle une 
boule. 

Dans ce qui suit, nous étudierons des fonctions à 
deux variables x et y, ou à trois variables, x, y et z ; 
mais les résultats se généralisent à n variables. 

Les ensembles D de R n sont susceptibles de rece¬ 
voir les mêmes définitions que les intervalles sur R 
(ensembles bornés, points d’accumulation, ensembles 
fermés, etc.) et le théorème de Bolzano-Weierstrass est 
toujours vrai, ici aussi (voir ce théorème p. 107). 

Enfin la continuité d’une fonction f de plusieurs 
variables se définit avec autant de rigueur que celle 
d’une fonction à une seule variable. Nous nous conten¬ 
terons, ici, d’une description intuitive : dans le cas 
illustré par la figure précédente, un changement infini¬ 
ment petit des variables, remplaçant un point m du 
domaine de définition par un point m f infiniment 
voisin, entraîne un changement infiniment petit de la 
fonction, c’est-à-dire transforme M en un point voisin 
M' sur la surface. 


Dérivées partielles et dérivées totales. 


• Dérivées partielles. Considérons la fonction 
u = f(x, y, z). Si l’on donne à y et z des valeurs 
constantes, en supposant que x seul varie, on peut 
définir la dérivée de u par rapport à x : 


(on écrit aussi : u' = d x u, ou 3 x f). 

La lettre « 3 » n’est pas un delta (« 8 »), mais un « d 
rond » ; on l’utilise pour bien préciser qu’il s’agit d’une 
dérivée partielle. Dans le cas u = f(x, y, z), on défini¬ 
rait ainsi trois dérivées partielles : 

3 u 3ty jUv ( 8 ) 

3x ’ 3y dz 


On pose souvent, dans le cas d’une fonction de 
2 variables, z = f(x, y), 


3 f 
3x 


P 



Q 


(9) 


(notation de Monge). 

• Dérivée totale. Supposons que x, y et z soient 
des fonctions d’une même variable f, par rapport à 
laquelle elles admettent les dérivées dx/d t, dy/dt et 
dz/df (ce sont des dérivées et non des dérivées 
partielles). On montre que la dérivée de u = f(x, y, z) 
par rapport à t est : 

du _ 3 u dx au dy + tUv dz 
df — 3x df + 3y df 3z df 

du/dt exprime, si l’on veut, le « taux de variation » de 
la fonction u lorsque x, y et z varient toutes les trois, 
alors que du/dx ne concerne que la seule variation de 
x ; pour cette raison du/dt est appelée la dérivée 
totale de la fonction. 

Voici un exemple simple. Un cône circulaire a pour 
rayon r = 10 m et pour hauteur h = 100 m ; il subit une 
double déformation : le rayon r augmente à la vitesse 
de 1 mètre par seconde et la hauteur h diminue à 
raison de 10 mètres par seconde. On demande d’expri¬ 
mer la variation du volume de ce cône. 

Soit y ce volume : il est égal au tiers de la surface de 
base, t rr 2 , multiplié par la hauteur, soit y=^r 2 h/3. 
C’est une fonction de deux variables indépendantes, r 
et h, dont les dérivées partielles sont : 


3y 
3 r 



et 


dy _ 1_ 
3/7 “ 3 


( 11 ) 


Les variables r et h sont des fonctions du temps t ; 
on a dr/dt = 1 (m/s) et dh/dt = - 10 (m/s) (diminution 
de hauteur). 

La dérivée totale dy/dt exprime le taux de variation 
du volume du cône en fonction du temps. On a, d’après 
la formule ci-dessus, 

dy = 3y dr ay d h_ 

dt dr dt dh ' df ’ ( f 

soit, avec les données r=10, h — 100, dr/df=1 et 
dh/dt = -10, 


~r~ — § - 'rr x 10 x 100 x 1 — IttxIOOxIO 
df 3 3 

1 000 TT 3 . 

=---= 1 047,2 m /s . 


(13) 


• Différentielle totale. En multipliant par df 
l’expression de la dérivée totale on obtient la différen¬ 
tielle totale de la fonction u : 


du 3u du 
du =— dx + — dy + — dz 
3x 3y 3z 


(14) 


(Les expressions comme (3u/3x) dx sont des différen¬ 
tielles partielles.) 


Fonctions composées, homogènes et implicites; 
notion de gradient. 

Voir p. 154. 


Suites et séries. 


Définitions. 

• Une suite de nombres est un ensemble 
ordonné de nombres dont la valeur dépend de leur 
rang. On appelle u n le terme de rang net l’on note : la 
suite u n ou (u n ). Exemples : 


u n = n 

1, 

2, 

3, .. 

., n 

u n = 2 n : 

2, 

4, 

6, .. 

., 2 n 

u„ = n 2 : 

1, 

4, 

9, .. 

., n 2 , 
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Si l’on forme la somme des termes d’une suite, on Soit F(x) une fonction définie sur [a, b]. S’il existe, 
obtient une nouvelle suite de termes : pour tout e > 0, un entier N tel que, pour tout n > N : 

Si = u v S 2 = u,+ u 2 ,... S n = + u 2 + — h u n ,... (1) Vx G [a, b], \ f n {x) - F(x) | < e (11) 


La suite S n et la suite u n sont dites associées ; leur 
association constitue, au sens strict, une série. La 
connaissance des termes u n permet de construire la 
suite S n et la connaissance des termes S n (qu’on 
appelle les sommes partielles) permet de déterminer 
u n , puisque : 

= Si, u 2 = S 2 - u, = S 2 - S,, ..., 

u n ~ S n — S n _i. (2) 

Une série est donc parfaitement déterminée quand 
on donne l’une des deux suites. En général, on donne 
u n ; les termes u n peuvent être des nombres (série 
numérique) ou des fonctions (série de fonctions). 

• Une série est dite convergente si la suite S n a 
une limite S quand n—► + <»; elle est dite divergente 
dans le cas contraire. Si elle est convergente on écrit : 

S = i/-| + u 2 + ••• + u n + ••• (3) 


• Voici quelques exemples simples de séries. 
— Série arithmétique : chaque terme de la suite 
u n est égal au précédent augmenté d’une grandeur 
constante r appelée raison de la série. Ainsi : 

1, 3, 5, ..., (2 n +1),... (4) 

est une suite de raison 2(3 = 1+ 2;5 = 3 + 2; ...) ; la 
suite associée est : 

S 1 = 1, S 2 = 4, S 3 = 9, ..., 

S n =(1 +2 + - + n), ... (5) 

On démontre que le n e terme est donné par : 


S n 


n (n +1) 
2 


( 6 ) 


Plus généralement, si u i = a, on démontre que : 


u„ = a + (n - 1) r et S n 


n( V U jj - (7) 


— Série géométrique : chaque terme de la suite 
u n est obtenu en multipliant le précédent par un 
nombre constant q, raison de la série, le premier 
terme, u^ = a, étant différent de 0 et q ^ 0. Ainsi : 


la suite de terme général f n (x) est dite uniformément 
convergente sur [a, b]. On dit aussi que F(x) est la 
limite uniforme de f n (x). 

Cette limite F(x) est continue sur [a, b] : la conver¬ 
gence uniforme conserve la continuité. 

La notion de convergence uniforme est plus étroite 
que celle de convergence. Par exemple, la suite 
f n (x) = (n- 1) sin x/(1 + nx) est une suite de fonc¬ 
tions continues sur [0,1]. Pour n très grand 
f n (x) —> F(x) = sin x/x : la suite est donc convergente 
(au sens ordinaire) car on a : 

IW-F(x)|<e. (12) 

Mais si x = 0, on a f n (x) = 0 quel que soit n ; donc, 
pour cette valeur de x, f n (x) ne tend pas vers sin x/x : 
la fonction F(x) n’est pas définie pour x = 0 ; la 
continuité n’est pas conservée pour cette valeur de la 
variable. 

CALCUL DIFFÉRENTIEL 
ET INTÉGRAL 

Généralités. 

Historique. 

Page 104, nous avons vu comment Newton et 
Leibniz ont introduit, à la fin du XVII e siècle, un 
nouveau type de calcul, portant sur des infiniment 
petits, notés dx, dy, etc., par Leibniz. Le symbole 
« dx » se lit « différentielle de x » ou, en abrégé 
« d-de-x » ou encore «d-x». En étudiant le calcul 
des dérivées, nous avons appris à évaluer le quotient 
de deux infiniment petits dy et dx, lorsqu’ils tendent 
vers zéro en même temps : la limite, si elle existe, de ce 
quotient est la dérivée y' de la fonction y = f(x), 
dérivée qui s’écrit : 


c = 1, u 2 = 2, u 3 = 4, ..., u n = 2"-\ ... (8) 

est une suite géométrique de raison 2 et de premier 
terme u, = a = 1. La suite associée est : 

S, = 1, S 2 = 3.S„ = 1 + 2 + ••• + 2"-’,... (9) 

Plus généralement, le terme u n de rang n est 
u n = aq n ~' et S„ = a(q n - 1)/(q- 1). 

Le célèbre problème de l’échiquier est une illustra¬ 
tion de cette formule ; un sage mathématicien aurait 
demandé à son maître, qui lui proposait de choisir une 
récompense qu’il désirait : « Mets 1 grain de riz sur la 
première case d’un échiquier, 2 sur la deuxième, 4 sur 
la troisième, et ainsi de suite, en doublant jusqu’à la 
dernière ». Comme il y a 64 cases sur un échiquier, le 
nombre de grains de riz à placer sur la dernière case 
est aq n ~\ soit, puisque ici a = 1, q = 2, u 64 = 2 63 ; 
quant au total, S n , sa valeur est : 

S„ = a— —-r- = 2" — 1 = 2 e4 — 1 , (10) 

n q - 1 

c’est-à-dire un nombre de 20 chiffres ! 

Convergence d'une série. 

L’étude de la convergence d’une série est, en ana¬ 
lyse, une question importante, car de nombreuses 
fonctions sont définies par des séries. On établit le 
théorème suivant : 

Une série est convergente si, et seulement si, il existe 
un entier N tel que, pour tous n et m > N, on ait 
I S m - S n I < e, pour tout e > 0 donné. 

Ce théorème énonce une condition nécessaire et 
suffisante de convergence : si la série est conver¬ 
gente, la condition est vérifiée ; si la condition est 
vérifiée, la série est convergente. Mais il est peu 
commode à utiliser ; c’est pourquoi, en pratique, on 
utilise des critères suffisants de convergence, qui ne 
permettent de conclure que sous certaines conditions : 
formule de Stirling, règle de Cauchy, etc. 

L’étude des séries étant technique, nous avons 
regroupé les résultats principaux p. 155. 


Convergence uniforme. 


Le calcul différentiel, à sa naissance, est principale¬ 
ment le calcul des dérivées, considérées comme le 
quotient de différences (= différentielles) infiniment 
petites, dy, dx. Il a comme complément naturel le 
calcul sommatoire, comme on l’appelait alors, c’est-à- 
dire la recherche de la limite vers laquelle tend une 
somme de grandeurs infiniment petites : ce calcul était 
employé depuis Archimède, en géométrie, pour la 
recherche des aires et des volumes. L’expression 
calcul intégral, pour le désigner, a été vulgarisée par 
Jacques Bernoulli vers 1690; la notation en a été 
conçue par Leibniz qui écrit : 

Y = f f(x) dx , (2) 

une fonction Y qui admet f(x) comme dérivée et qu’on 
appelle une intégrale. C’est aussi Leibniz qui a donné 
les premières règles de calcul des intégrales dites 
définies (voir ci-après, p. 120). Toutefois il faut atten¬ 
dre Cauchy (1823) pour voir enfin une définition 
rigoureuse de l’intégrale s’imposer aux mathémati¬ 
ciens; cette définition sera précisée par Riemann 
(1854). Le problème de l’existence de l’intégrale d’une 
fonction est en rapport, évidemment, avec ces défini¬ 
tions ; il fut définitivement résolu par Darboux, en 
1875. En 1894, Stieltjes a donné une définition plus 
générale de l’intégrale d’une fonction, et, en 1902, 
Lebesgue a encore étendu le concept. 

Notion de différentielle. 

• Remarques sur la notation différentielle. Nous 
avons écrit, indifféremment : 

Y*— f( x ) ou K'=^, (3) 

pour noter la dérivée y' d’une fonction f(x) dans un 
intervalle de définition donné. 

Le symbole dy/dx est une manière conventionnelle 
d’écrire la limite (si elle existe) de la fraction Ay/Ax 
quand Ax tend vers zéro avec les réserves énoncées 
plus haut. Le symbole dy/dx doit donc être considéré, 
pour l’instant du moins, en bloc. On écrit aussi le 
symbole d/dx appelé facteur de différentiation : il 
indique qu’on décide de calculer la dérivée d’une 
fonction (simple ou composée) par rapport à la variable 
x. On écrit donc : 


Soit une suite de fonctions numériques ^(x), f 2 (x),... 
f n (x), ... définies et continues sur un intervalle [a, b]. 


, d . dy 
y x = — f(x) = ~r ~. 
dx dx 


(4) 


SUITES ET SÉRIES 


Si y = u -f v, on peut aussi écrire : 


, d . dy 

y =— u + v) = 
dx -dx 


(5) 


etc. 

Il se présente cependant des problèmes où il est 
commode de pouvoir considérer dy et dx séparément, 
comme s’il s’agissait du numérateur et du dénomina¬ 
teur d’une fraction. Cela est possible si l’on introduit la 
notion de différentielle. 


• Définition: On appelle différentielle d’une 
fonction y = f(x) dérivable la fonction linéaire qui à h 
associe le produit, f'(x) x h, de sa dérivée par h. 

On note : 

différentielle de y = dy = f \x) x h . (6) 

Si y = x, on a f\x) = 1, d’où 

différentielle de x = dx = 1 x h = h . (7) 

Par suite, on peut écrire 

dy = f'(x) x h = f\x) dx : (8) 

la différentielle d’une fonction s’écrit comme le produit 
de sa dérivée par la différentielle de la variable. 

Cette définition possède une signification géométri¬ 
que importante. Soit une courbe C représentant la 
fonction y = f(x) et la tangente MT au point M(x, y) ; 
un accroissement h de la variable correspond au point 
M a de coordonnées Xi = x + h et y 1 = f(x + h) = f^x^. 
On voit sur la figure ci-après que : 


tan 6 


HT 

h ’ 


d’où 


HT = h x tan 0 . 


(9) 


Mais tan 0= y' (signification géométrique de la déri¬ 
vée, voir n° 517.3, C, a) ; don'c 

HT = h x f (x) = dy (10) 

La différentielle d’une fonction (= dy) est égale à 
l’accroissement HT de l’ordonnée de la tangente en M, 
pour un accroissement h = x 1 - x de la variable. 



Signification géométrique de la différentielle d’une 
fonction. 


Remarque : Nous n’avons fait aucune hypothèse 
sur la nature de dx, qui peut être aussi bien fini 
qu’infiniment petit. Dans ce dernier cas, dy est alors, 
lui aussi, infiniment petit et l’on montre que Ay/dy-* 1, 
c’est-à-dire que l’accroissement Ay de la fonction a 
pour partie principale dy, quand h = dx—>0. Doréna¬ 
vant — sauf précision contraire — nous considérerons 
dx et dy comme des infiniment petits. 

L’intérêt de la notion de différentielle réside notam¬ 
ment dans le fait qu’elle facilite les opérations de 
dérivation dans le cas d’un changement de variable. 

• Calcul des différentielles. Il ne présente 
aucune difficulté particulière et se ramène au calcul 
des dérivées, puisque dy = F(x)dx. Exemples : 

y = 5x 2 :y' = 10x et dy=10 xdx; (11) 

y=uv:y'=u'v+v'ue t dy = du v+ d vu. (12) 

On peut aussi écrire : 

d(5 x 2 ) = 10 x dx, etc. (13) 


• Dérivées d’ordre supérieur. Une notation dif¬ 
férentielle est parfois employée pour les dérivées 
d’ordre supérieur. Ainsi note-t-on : 


y 


£y... „<«> = 

dx 2 “ dx" ' 


(14) 


Aucun artifice ne permet, comme c’était le cas pour 
y' = dy/dx, de considérer, par exemple, d 2 y/dx 2 ou 
d 4 y/dx 4 comme des quotients. 
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CALCUL INTÉGRAL 


Le mathématicien et le percepteur. 

Tout le monde connaît le principe des tranches 
d’impôts. Pour évaluer l’impôt sur le revenu dû par un 
contribuable, on divise son revenu x en tranches (les 
mathématiciens diraient : en intervalles), et l’on appli¬ 
que à chaque tranche un taux progressif. Prenons 
l’exemple d’une loi fiscale qui prévoirait un taux 
t, = 0% pour un revenu compris entre 0 et 100 (100 
étant exclus), ce qui s’écrit, mathématiquement : 

Vx, x G [0, 100[, t = 0 ; (15) 

un taux t 2 = 5 % pour la tranche allant de 100 à 300, 
300 étant exclus, soit: 

Vx, x G [100, 300[, t = 0,05 ; (16) 

et de même : t 3 = 10% pour la tranche allant de 300 à 
500 (exclus), t 4 = 20% pour la tranche allant de 500 à 
700 (exclus), t 5 = 30% pour x 2= 700. 

Chaque tranche supporte donc un impôt y v y 2 , ..., et 
l’impôt global dû par le contribuable est : 

y — Yi + y 2 + y 3 + y 4 + y 5 . 0 7 ) 

qu’on peut écrire avec le symbole 2 : 

< 5 5 

y = 2 y., ou, plus simplement, 2 Y> • (18) 

, = i i 

Cela peut se représenter graphiquement de la façon 
indiquée sur la figure ci-après : 



1 

Calcul d’impôt. 

I - Courbe des taux : t est constant dans chaque 
intervalle, t(x) est une fonction en escalier. 

II - Courbe correspondante des impôts : la crois¬ 
sance n’est pas la même dans chaque << tranche » ; la 
fonction y = f(x) est dite polygonale. Pour déterminer 
combien un contribuable paye d’impôt, il suffit de 
mener la parallèle à Oy issue du point M d’abscisse 

Om = a = revenu considéré. 


pour a = 450, l’impôt est : 

1 re tranche : 100 x 0 = 0 = y 1 , 

2 e tranche : 200 x 0,05 = 10 = y 2 , 

3 e tranche : 150 x 0,1 = 15 = y 3 , 

d’où : 

y = Yi + y 2 + y 3 = 25 ■ 0 9 ) 

Donnons à ce calcul une allure plus générale et plus 
mathématique : 

— Chaque tranche correspond à un intervalle 
ouvert à droite, [x 0 , x^, [x 1( x 2 [, ..., auquel appartient la 
variable x (le revenu). La « largeur » d’un tel intervalle 
est \ A x = x 1 - x 0 pour le premier, A 2 x = x 2 - x 1 pour le 
second, et ainsi de suite. 

On a calculé y par la relation 

y' = t, x A,x + f 2 x A 2 x + ••• + f s x A 5 x 

= È ti Ai x , (20) 

ou encore, puisqu’il n’y a pas d’ambiguïté, 

y = 2f(x) Ax, (21) 

t(x) étant une fonction en escalier. 

Supposons maintenant qu’on veuille appliquer la loi 
fiscale avec une plus grande justice. Il faudra découper 
le revenu du contribuable en plusieurs tranches, dont 
l’épaisseur, Ax, sera très petite : par exemple Ax = 100, 
ou Ax = 10,... ; à la limite, on sera conduit à tenir 
compte de tranches infiniment petites, dx, de revenu, 
auxquelles s’appliquent le taux t(x) ; et, pour calculer 
y, nous devrons faire la somme de tous les produits 
f 1 dx, f 2 dx, ..., qui seront en quantité infinie. Au lieu 
d’écrire cette somme avec un S, nous la désignerons 
par le symbole / qui se lit « intégrale » et nous aurons : 

au lieu de y = 2 f(x) Ax , y = / t(x) dx . (22) 

La fonction y est appelée l’ intégrale de la fonction 
f(x). En passant ainsi à la limite, la ligne polygonale qui 
représentait y se transforme en une courbe continue 
y = f(x) dont la dérivée est y' = dy/dx = t(x). 

(Nous avons vu, en effet, que chaque « tronçon » du 
graphique de y = S f(x) Ax correspond à un «saut» 

Ay 

Ay = t (x ) Ax , d’où t (x ) = — ; quand Ax -» 0, t (x ) 
est, par définition, la dérivée de la fonction y.) 

Le mathématicien et l'arpenteur. 

Soit à mesurer l’aire comprise entre une courbe 
d’équation y = f(x), l’axe des x et deux ordonnées aA 
et bB, parallèles à l’axe des y, d’abscisses x = a et 
x = b ; pour fixer les idées, prenons la courbe y = 1/x, 
a = 1 et b = 3. Nous avons vu (p. 112) que, par 
définition, cette aire est égale à In 3. Pour la calculer, 
divisons l’intervalle [a, b[ en tranches d’épaisseur Ax 
très petite (par exemple Ax = 1 mm, ce qui fournit, 
entrer = 1 et b = 3, vingt « tranches »). Considérons, 
d’autre part, les rectangles de largeur Ax et de 
longueurs : 


ils ont pour surface : 

s, =^-XAx (x, = x,,x a , ...)• (23) 



Calcul d’une surface. 


La « courbe » Il de la figure ci-dessus a été construite 
de sorte que, pour chaque valeur de x, la 

somme y = S y, puisse être lue immédiatement. Dans 

i 

chaque intervalle [x,, x, +1 [, le graphique est une ligne 
droite représentant la fonction y = tx. Par exemple, 


La somme des valeurs S y donne une approximation de 
la surface S cherchée : 


'v 3 1 * ' v 3 Ax 

F’ 


(24) 


Quand Ax-">>0, S^lnx (par définition) et l’on peut 
écrire, comme précédemment, en remplaçant X par / : 

S = J 3 -^dx = In 3. (25) 

Si l’on avait cherché à calculer la surface comprise 
entre deux ordonnées quelconques d’abscisses a et b, 
on aurait trouvé, plus généralement: 

S b y — Ax f — dx = In b - In a . (26) 

3 X, Ja X 


Comparaison de ces deux exemples. 

• Dans le premier cas (calcul d’un impôt), nous 
sommes partis d’une fonction en escalier t(x), pour 
calculer un impôt y = 2 t(x) Ax ; puis, en passant à la 
limite, c’est-à-dire en considérant que les « marches », 
Ax, de cet escalier devenaient des infiniment petits dx, 
nous avons écrit y = J f(x)dx. 

• Dans le second cas, nous sommes partis de la 
fonction continue f(x) = 1/x, pour calculer une aire S ; 
puis nous avons remplacé le graphique continu de 
y = 1 /x, par le graphique discontinu d’une fonction en 
escalier, dont les « marches » avaient pour largeur Ax. 
Nous avons ainsi calculé une approximation de S, 

-| 

notée y —x Ax et, en passant à la limite, nous avons 

a X, 

écrit : 

S b . = j b ^dx (27) 

• Plus généralement, il est possible, lorsqu’une 
fonction f(x) est continue : 

— de l’approximer par une fonction en escalier 
et de calculer une approximation de Y égale à 

£ f ( x i ) Ax ; 

— de passer à la limite, et de calculer avec 
rigueur Y = £ f{x) dx. 

Le calcul de Y à partir de y s’appelle une intégration, 
ou un calcul intégral ; Y est une intégrale de y. Nous 
venons de voir qu’il permet d’évaluer un impôt ou une 
surface. Mais, bien entendu, si l’intérêt du calcul 
intégral se limitait à faciliter le travail de l’Inspecteur 
des impôts directs ou de l’arpenteur, il ne mériterait 
pas tous les efforts que lui ont consacrés les mathéma¬ 
ticiens depuis Leibniz. En fait, ce vaste domaine de 
l’analyse s’applique, au premier chef, à toutes les 
branches des sciences physiques ; mais, surtout, il 
constitue une théorie mathématique très complète et 
très générale, dont nous allons indiquer maintenant les 
principes. 


Intégrales définies. 

L'intégrale simple. 

Nous allons donner aux définitions intuitives qui 
précèdent une forme rigoureuse. 

Soit une fonction f(x), définie, réelle et bornée sur un 
intervalle [a, b]. Le « découpage en tranches » de la 
variable x consiste à choisir sur [a, ô] les points 
(valeurs) successifs x 0 = a, x 1t x 2 ,..., x n , x n+v ..., b et à 
considérer les intervalles [a, xJ, [x^ x 2 ], ..., [x p , x p+1 ], 
.... [x n , b]. Sur chaque [x p , x p+1 ], prenons une valeur 
arbitraire de x, que nous nommerons £ p (£est la lettre 
grecque xi), etiformons les produits : 

(x, - a) fU o), (x 2 - x,) f(Ç,), ..., (b - x n ) f(Ç n ), (1 ) 

f(£,) étant la valeur que prend f(x) quand x = £, (dans 
l’exemple du calcul d’un impôt, £, était le taux de 
chaque tranche). 

Cela posé, on dit que f(x) est intégrable au sens de 
Riemann sur [a, b ] si la somme : 

S = (x, - a) f{( o) + ••• + (x p+1 - x p ) f(Ç p ) + 

+ - + (b-x n )f(( n ) (2) 

tend vers une limite finie I, quel que soit le choix des 
£ p , lorsque le nombre des x p tend vers l’infini et que le 
plus grand des intervalles [x p , x p + 1 ] tend vers 0. 

Si f(x) est intégrable au sens de Riemann, ou, plus 
brièvement, intégrable, on écrit : 

/ = J f (x ) dx , (3) 

notation qui se lit : « intégrale (ou somme) de aà bde 
f{x) dx ». 
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INTEGRALES DEFINIES 


• Remarques : 

— / est un nombre réel, fonction de x ; on 
précise éventuellement /,?. a et b sont les limites 
d’intégration ; a est : la limite inférieure, b la limite 
supérieure ; 

— le nombre / s’appelle Vintégrale définie de 
f(x) dx sur [a, b ] ; 

— le calcul de / est une intégration ; c’est, en 
général, un calcul difficile (néanmoins, nous avons vu 
qu’il était simple dans le cas où f(x) est une fonction en 
escalier). 


Propriétés des intégrales définies. 

• On démontre aisément les formules suivan¬ 
tes : f(x) et g(x) étant supposées intégrables sur [a, toi, 

/: = 0; l b a = - Il ; 

J À dx = A (b - a) (A = C“) ; 

J a Af(x)dx = A j" f(x) dx ; (4) 

/„ [f(x) + g(x)]dx = 
f(x)sg(x)^ f(x)dx^J^ 9 (x ) dx 
(si a < b). 

• Une fonction n’est pas, a priori, intégrable sur 
[a, to]. Il est donc nécessaire, avant de calculer une 
intégrale, de démontrer qu’elle existe, c’est-à-dire que 
la fonction considérée est intégrable sur [a, to]. On se 
sert, pour cela, de théorèmes généraux rappelés à la 
p. 155. 

L’ensemble des fonctions intégrables sur un inter¬ 
valle [a, to] possède la structure d 'espace vectoriel sur 
U (voir p. 46). 

• Valeur moyenne d une fonction intégrable sur 
[a, to] : c’est l’expression 

—-— f f(x) dx . (5) 

to - a J a 

Cette formule est d’un usage courant en statistique. 
Commentons-la rapidement sur un exemple. On a 
classé un échantillon de population en fonction du 
revenu fiscal x des individus ; le résultat de l’enquête 
est le suivant : 


f (x) dx + g (x) dx ; 

-'a 



Les vitres rectangulaires, sous le dôme du Centre national des industries et des techniques, donnent une 
représentation visuelle de la méthode utilisée en calcul infinitésimal pour trouver la surface délimitée par une 

courbe. 


Revenu 

fiscal x 

Nombre 

d’individus 
y ayant 

un revenu 

fiscal x 

Largeur 

Ax de la 

tranche 

Produit 
y x Ax 

0 ss x < 100 

10 

100 

1 000 

100 ^ x < 300 

20 

200 

4 000 

300 *£ x < 500 

100 

200 

20 000 

500 ^ x < 700 

70 

200 

14 000 

70p ^ x < 1 000 

30 

300 

9 000 

1 000 ^ x < 2 000 

10 

1 000 

10 000 


58 000 


Certes, ce tableau ne donne pa§ des informations 
très précises : nous savons, par exemple, qu’il y a 100 
personnes dont le revenu est compris entre 300 et 500, 
mais nous ignorons comment elles se répartissent 
dans ces limites. Acceptons cette imprécision. La 
somme des produits y x Ax donne la somme totale des 
revenus de l’échantillon étudié ; d’autre part, le nombre 
y d’individus ayant un revenu x est une fonction de x. 
Si l’on fait le rapport 

58 000 = 58 000 = 

2 000-0 2 000 ’ V ; 

on obtient, avec approximation, la valeur moyenne y 
(« y surligné ») de la fonction y sur l’intervalle [0, 2 000] 
des revenus ; on écrit ; 

2 y Ax 

ÿ — — - (ici, a =0, to =2 000). (7) 

to — a 

Cette moyenne est dite pondérée par Ax, ce qui 
exprime que chaque valeur de y est multipliée par un 
coefficient. Si toutes les tranches étaient de même 
épaisseur, la pondération serait dite uniforme. 

Soit maintenant la fonction y = 1/x, continue dans 
l’intervalle [2, 3] ; quelle est sa valeur moyenne sur cet 
intervalle ? On peut, certes, procéder à un découpage 

1 f b 

en tranches ; mais la formule —- f(x) dx est 

b - a J a 

évidemment plus heureuse. 



Le yenri, ou principe du cercle, forme première du 
calcul infinitésimal au Japon, est attribué tradition¬ 
nellement à Seki Kôwa, un mathématicien 
du XVII e siècle. Le dessin, datant de 1670, donne la 
surface du cercle à partir de la somme des surfaces 
d’une série de rectangles. 


Nous avons vu plus haut que 

b i 

- dx = In to - In a ; 

3 x 

donc, ici : 

ÿ = gTrjj < ln 3 — In 2) = In ^. (8) 

Remarque : Pour x = 2, y = 1 /2 ; pour x = 3, y = 1 /3. 
Donc, puisque 1/3<y<1/2, le résultat précédent 
permet une approximation (grossière) de In 3/2: 

0,333 33 < In |< 0,5. (9) 


Primitives et intégrales. 


• Primitives. Considérons le tableau de dérivées 
suivant, où C désigne une constante : 


Y 


Y = x + C 

y 1 

Y kx +C 

y = k 

Y = x * 2 + C 

y = 2 x 

Y = In x + C 

1 

y — 


X 


Les fonctions Y, 

qui 

admettent y pour dérivée, sont 

dites primitives de 

y; 

ainsi : 



(Primitives de y = 

= x) 

Y = 

x ' -, 

T +C; 

(10) 

(Primitives de y = 

4> 

= In x 

+ c 

(11) 

(Primitives de y = 

■b 

= In x 

+ In C 




= In Cx. 

(12) 


La constante C explique que l’on parle des primiti¬ 
ves de y et non de la primitive de y, car C peut prendre 
une infinité de valeurs, et à chacune d’entre elles 
correspond une primitive particulière de y. 

Par contre, si l’on impose à Y d’obéir à certaines 
conditions, la constante C n’est plus arbitraire. Par 
exemple, si l’on demande de calculer la primitive de y 
qui s’annule pour x = 5, on procédera de la sorte : 

1 - Les primitives de y = x sont données par la 
formule générale : 


F(x)= V =Y +C 


(13) 

2 - Si x = 5, on a : 



F(5) = ^+C. 


(14) 

3 - On veut que F (5) = 0, donc C = 

25 

2 ' 



x 2 25 

4 - La primitive cherchée est F (x ) = —-—. 
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COURBES, SURFACES, VOLUMES 

Enfin, si F(x) et G(x) sont deux primitives de f(x), on a 
obligatoirement : 

F(x) - G(x) = C (constante), (15) 

puisque, en dérivant les deux membres, on obtient : 

F'(x) — G'(x) = 0. (16) 

• Calcul des intégrales définies. On démontre le 
théorème suivant : J f(x) dx pour t appartenant à 

l’intervalle [a, b ] est une primitive de la fonction f(x), 
supposée continue sur [a, b]. En conséquence de ce 

théorème, I = J f(X) dx peut se calculer par la for¬ 
mule fondamentale suivante : 

j b f(x)dx = F(b)-F (a), (17) 

F(x) désignant une primitive continue de f(x). 

Ainsi donc Vintégration d’une fonction f(x) sur un 
intervalle [a, b] se ramène à la recherche des primiti¬ 
ves de f(x). Mais on doit souligner ceci : s’il existe un 
couple de fonctions f(x) et f (x) tel que la seconde soit 
dérivée de la première, alors f(x) est une primitive de 
f(x), mais cela ne signifie pas que f(x) soit intégrable 
au sens de Riemann. On peut montrer, en effet, que 
dans certains cas, f(x) n’est pas intégrable (Volterra). 
C’est pourquoi on ne peut pas dire que l’intégration est 
l’opération réciproque de la dérivation. 

• Signification géométrique de ' intégrale défi¬ 
nie. Supposons a < b ; l’intégrale définie/ f{x) dx 

•I a 

représente l’aire comprise entre la courbe (C), graphi¬ 
que de f(x), l’axe Oxet les parallèles à Oyd’abscisses a 
et b. Cette aire est positive si f(x) 0 (courbe 
«au-dessus» de Ox), négative si / r (x)^0 (courbe 
« au-dessous » de Ox). 



L’intégrale définie est l’« aire de la courbe », c’est- 
à-dire l’aire comprise entre aA, bB, l’axe Ox et la 
courbe (C). On a indiqué le signe de l’aire des 
différentes zones. 


Ainsi, dans le cas de la figure ci-dessus, l’aire totale 
colorée est donnée par : 

S = j C (f) dx + f(x) dx + J° nx)dx 

= \ f(x) dx , (18) 

J a 

ou, plus simplement : 

S = l c a + l d c + l b d = l b a . (19) 

Extension de la notion d'intégrale définie. 

• Limites infinies. Si f(x) est intégrable sur 
[a, b], on peut se demander ce que devient l’intégrale 
! b a quand b —» + oo ; si l a a une limite quand b —> + », on 

la représente par f(x) dx. On dit alors que l’inté- 

•'a 

grale converge, ou encore qu’elle a un sens. Dans le 
cas contraire, on dit qu elle diverge, ou qu’elle n’a pas 
de sens. De même, si la limite inférieure de l’intervalle 
tend vers - oc, et si l a a une limite quand a —> - °°, on 
écrit 

1° f(x)dx = /-« . (20) 

• Exemple: Soit l’intégrale définie 


Comme on a ^ 

y= 7^ y,= -p' (21) 

une primitive de 1/x 2 est F(x) = -1/x et l’on peut 
écrire : 


'/ jjï-F(N)-F(1)- 




( 22 ) 


Quand A/^ + oo, 
sens et vaut 1. 


1/A/- 


>0 ; donc J (1/x 2 )dx a un 


• Remarque. Ne pas confondre une intégrale 
dont la (ou les) limite(s) devient(nent) infinie(s), et qui 
converge dans ces circonstances, avec lintégrale 
indéfinie J f(x)dx, qui est ainsi nommée parce que, 
f(x) admettant une infinité de primitives de la forme 
F(x) + C, J f{x) dxest définie à une constante près. On 
écrit alors : 

f f(x) dx = F(x) + C, (23) 


C désignant la constante d’intégration. 

Une intégrale définie est un nombre (même quand 
ses limites tendent vers oo) si elle a un sens ; une 
intégrale indéfinie est une fonction, définie à une 
constante près. Exemple : 


f b dx 11 f dx 1 _ 

s = —5 = —'t" H — , mais —? =- l C 

J a x 2 b a J x x 


(24) 


• Intégration sur un intervalle ouvert. On peut 
aussi rencontrer le cas d’un intervalle tel que ] a, b] ou 
J a, b[, tel que f soit intégrable sur tout intervalle fermé 
[c, d] inclus. Rien ne permet d’affirmer a priori que 

l’intégrale j c f(x) dx a une limite si c —» a et si d—» b. 


Prenons par exemple f(x) intégrable sur ]a, b]. Cela 
signifie que f f{x) dx a un sens. Que se passe-t-il si 

J a+e 

£ —> 0, c’est-à-dire x—>a? 

— ou bien cette limite existe ; 

— ou bien cette limite n’existe pas, et l’on dit 
que l b n’a pas de sens pour x = a. 

On démontre, en analyse, des critères de conver¬ 
gence qui permettent d’affirmer la convergence d’une 
intégrale (voir p. 156). 


Calcul des intégrales simples. 

Voir p. 157, où l’on a donné les principales métho¬ 
des de calcul. 

Courbes; surfaces; volumes. 


A quoi servent les intégrales? 

La définition qui a été donnée p. 120, a une 
importance capitale : toute grandeur qui est la limite 
d’une somme de la forme Zf(x) Ax quand Ax —» 0 
peut être calculée par une intégration. En d’autres 
termes : si nous désignons par S la somme en 
question et par / sa limite quand Ax—> 0, on aura, pour 
tout s > 0 : 

I / — S I < e . (1) 

Nous allons voir, dans ce qui suit, que des grandeurs 
telles que : la longueur d’un arc de courbe, l’aire d’une 
surface, un volume, peuvent se mettre sous la forme 
£ f{x) Ax ou sous des formes analogues. D’où l’intérêt 
fondamental du calcul des intégrales définies. 


Longueur d'un arc de courbe. 

• Présentation du problème. L’arc de cour¬ 


Rectification d’une courbe. 

L’arc AB a pour longueur la limite de la somme des 
segments tels que AA,, A, A 2 , ..., lorsque ces 
segments deviennent infiniment petits et que leur 
nombre tend vers l’infini. 



be AB peut être divisépar les points A : , A 2 , A 3 ,..., A n ; 
la longueur de l’arc AB est définie comme la limite de 
la somme des segments AA], A 1 A 2 , A 2 A 3 ,... A n B 
lorsque n-»<»et que la longueur de chaque segment 
tend séparément vers zéro. Comme cette limite est 
aussi la longueur d’une certaine portion de droite, 
l’opération qui consiste à rechercher la longueur d’un 
arc de courbe s’appelle aussi rectification de la courbe 
(étymologiquement : remplacement de la courbe par 
une droite). 


• Courbe dans un repère euclidien (axes rectan¬ 
gulaires). 

— Soit y= f{x) l’équation de la courbe, a et b 
le^ abscisses des points A et B, s la longueur de l’arc 
AB ; on peut exprimer x et y en fonction d’un paramè¬ 
tre t, x(t) et y(t) ; on a, alors, s(t) = abscisse curviligne 
du point M(x, y). On démontre que : 

ds 2 = dx 2 + dy 2 (2) 

et que 

s = [ Vl + V" x 2 dx . (3) 

■I a 


— Exemple. Longueur de l’arc de cercle AB, 
sachant que le cercle a pour centre l’origine et pour 
rayon l’unité. L’équation du cercle est x 2 + y 2 = R 2 , 

x 

d’où, en différenciant, 2 x + 2 yy' = 0, d’où y' = - —. On 
a donc, avec y 2 = R 2 - x 2 : 


r ax -j: [s*^] dx 

i.: 


= ± R 


VR 2 


(4) 


Or, d’après la formule (14) page 156 : 

dx x 


/ 


donc 


__= arcsin — h C ; 

VR 2 -x 2 R 


± R \arcsin - arcsin ^ 


(5) 


( 6 ) 


Si l’on prend a = R et b = 0 (arc AB = -, en se 

limitant aux déterminations principales), on trouve : 

b a n A lb tt R 

arcsin—=0, arcsin— =- et l°=± —. (7) 


• Coordonnées polaires (voir figure à la page 
ci-contre). 

— On démontre que, dans un système (p, 6) : 

s = J Vp 2 + p ; 2 d0 
ou 

s = [ Vp 2 0; 2 +1dp . (8) 

Jp i 

— Exemple : longueur de la cardioïde 

p = a(1 + cos 0). On a ^ = - a sin 0 ; donc, si x varie 
d 6 

entre 0 et tt, le point P décrivant la moitié de la courbe, 

s = [ Va 2 (1-F cos 0) 2 + a 2 sin 2 6 66 (9) 

y o 

= a f V2 + 2 cos 0 d 0 = 2 a f cos ^ d 0 = 4 a . 

J o ’ J o 2 

La longueur de la cardioïde est 2 s = 8 a. 

• Remarque: La rectification de l’ellipse 
conduit à calculer des intégrales de la forme : 

/= ff[x, P(x)]dx, (10) 

P{x) étant un polynôme de degré n supérieur à 2. Une 
intégrale telle que (10) est appelée intégrale elliptique 
pour n = 3 ou 4, et intégrale hyperelliptique pour 
n > 4. Ces intégrales ont été calculées — avec peine ! 
— par Le Gendre. Par exemple soit une ellipse d’équa¬ 
tions paramétriques : 


x = a cos <p ; 
y = b sin <p . 


( 11 ) 


(voir p. 151). La longueur s d’un arc AB (A : cp = 0 ; 
B : cp = (p) est donnée par l’intégrale elliptique : 

s = | Va 2 sin 2 <p + b 2 cos 2 <p d<p , (12) 

J 0 
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ÉQUATIONS DIFFÉRENTIELLES 



En coordonnées polaires, l’équation de la cardloïde 
exprime la relation entre la distance OP = p d’un 
point de la courbe à l’origine et l’angle 6 que fait le 
rayon vecteur OP avec l’axe Ox. On montre que cette 
relation est : p = a(1 + cos 0). 


qui peut aussi s’écrire en posant e = c/a (excentricité 
de l’ellipse) : 

. <p __ 

s = b J v 1 — e 2 sin 2 <pd<p = bE (e, <p ), (13) 

J O 

E(e, (p) est une fonction appelée intégrale de 
Le Gendre. 

• Notation. Soit M un point quelconque de l’arc 
AB à rectifier ; désignons par V(M) une fonction 
vectorielle caractérisant le point M : 

V(M) = OM (14) 

et par dM une variation infinitésimale de V(M). La 
longueur de l’arc ÂÈ est l’ intégrale curviligne : 

s = L V(M)dM. (15) 

J AB 

Pour une courbe fermée (C), s désigne la longueur / 
du contour fermé : 



• Aire limitée par un contour fermé. Soit un 
contour (C) d’équation y = f{x). L’aire A de la surface 
plane limitée par ce contour a pour valeur : 

A = [ f{x) dx , (17) 

J(C) 

qu’on appelle intégrale curviligne le long de la courbe 
(C). Si la courbe est donnée en coordonnées polaires 
par : 

x = p cos 0 et y = ps\nO, (18) 

on démontre que : 

A =1 f p 2 de. (19) 

4 J ( C ) 

Par exemple l’ellipse d’équation (voir p. 151) : 



a pour aire A = tt ab. En effet, en se limitant au 
quadrant AOB (abscisse de A = a ; abscisse de B = 0 ; 
voir figure p. 151) d’aire égale au quart de l’aire A de 
l’ellipse, on a : 

4 = — f Va 2 -x 2 dx . (21) 

4 a Jo 

Intégrales doubles, intégrales triples. 

• Intégrale double. Considérons, dans le plan 
xOy, un domaine fermé (D) limité par un contour (C) ; à 
chaque point de (D), de coordonnées xet y, associons 
un point de cote z = f(x, y). L’équation z = f(x, y) est 
représentée par une surface (S) dont tous les points se 
projettent orthogonalement sur (D). Un cylindre droit 
de base (D) est tel que ses génératrices coupent la 
surface (S) sur son contour ; nous allons nous propo¬ 
ser de déterminer le volume du solide limité par (D), (S) 
et la surface cylindrique. 

1 - Divisons (D) en un grand nombre de petits 
rectangles déterminés par des parallèles à Ox et Oy, 
distantes entre elles de A y et Ax. Chaque rectangle a 
une surface w = Ax Ay. 

2 - Sur chaque surface œ, construisons un 
prisme de hauteur mM \ on a. rrrM = z= f(x, y). 


Le volume d’un tel prisme est f(x, y) x w. 

3 - A chaque point M, est donc associé un 
prisme de volume f(x,, y f ) eu, ; le volume total cherché 
est la somme X f{x„ y,) 

Il est préférable de faire apparaître les deux variables 
de ce volume, qui sont Ax et Ay ; on écrit alors, 
conventionnellement : 

\Z = 22 f(x, y) Ay Ax , (22) 

les deux « 2 » indiquant qu’il y a deux variables dans la 
quantité à sommer. 

Si l’on fait tendre Ax et Ay vers zéro, et si V tend vers 
une limite, cette limite s’écrit : 

V = JJ f(x, y)dydx . (23) 

Plus rigoureusement : étant donné une fonction 
f(x, y) définie sur un domaine fermé plan (D) limité par 
un contour simple (C), on dit que f est intégrable sur 
(D) si, (D) étant divisé en n domaines de surfaces oj,, la 
somme 2 f(x jt y) a>, a une limite, les points (x,, y) 
appartenant à chaque domaine co„ lorsque chaque 
domaine tend vers zéro, et cela quel que soit le partage 
de (D) et quels que soient les points (x,, y,). La limite de 
la somme 2 f{x„ y,) ct>, s’écrit : 

/= JJ f(x, y)dxdy. (24) 

• Intégrales triples. Elles se traitent sur le même 
principe que les intégrales doubles. On les rencontre 
dans les calculs de centres de gravité, de densité d’un 
corps en un point, de volumes, de moments d’inertie, 
etc. 

En raison du caractère « technique » de ces ques¬ 
tions, nous avons groupé les principaux résultats dans 
à la p. 157. 

Équations différentielles. 

Définition et exemples. 

• Définitions. 

On appelle équation différentielle une équation dont 
l’inconnue est une fonction y et dans laquelle figurent 
des dérivées y', y",... et/ou des différentielles dy, 
d 2 y,... de cette fonction. La fonction y cherchée peut 
être soit une fonction numérique y = f(x), soit une 
fonction vectorielle à n dimensions (2 ou 3 dimensions 
dans les cas usuels). Toute fonction y vérifiant une 
équation différentielle donnée est une solution particu¬ 
lière de l’équation. L’ensemble de toutes les solutions 
particulières est la solution générale de l’équation 
proposée. On appelle ordre d’une équation différen¬ 
tielle l’ordre de la dérivée la plus élevée qui figure dans 
l’équation : si cette dérivée est y', il s’agit d’une 
équation différentielle du premier ordre , si c’est y", il 
s’agit d’une équation différentielle du second ordre ; 
etc. 

Enfin, une équation différentielle peut être linéaire (si 
tous ses termes sont du premier degré), du second 
degré, du troisième degré, etc. (si elle contient au 
moins un terme du second degré, du troisième degré, 
etc.). 

• Exemples. 

— L’équation : 

y' = o (i) 

est une équation différentielle linéaire du premier 

ordre. Le calcul des dérivées (voir p. 114) nous a 
enseigné que toute fonction continue y = C te avait 
une dérivée nulle y' = 0. Donc y = 3, y = 4, y = - 1, 
etc. sont des solutions particulières de (1) ; la solution 
générale est y = C te . 

— L’équation : 

y'= y (2) 

est une équation différentielle linéaire du premier 

ordre. Nous avons vu, p. 114, que la fonction y = e x 
admettait pour dérivée y' = e x , c’est-à-dire vérifiait 
l’équation y' = y. Donc y = e x est une solution 
particulière de (2). 

— L’équation : 

y ' 

— = m (3) 

y 

exprime que la dérivée logarithmique y'/y de la fonc¬ 
tion y est constante ; on peut donc écrire, C désignant 
une constante 

In y = mx + C (4) 

(en dérivant les deux membres, on retrouve l’équation 
y'/y = m). L’équation (4) définit la fonction y, solution 
de (3). 

— On montre en Physique que la force F 


constante appliquée à une particule matérielle de 
masse m lui communique une accélération y, 
constante en grandeur, direction et sens. Appelons x(f) 
l’espace parcouru par la particule pendant le temps t, 
le principe fondamental de la dynamique : 

Force = masse x accélération (5) 

s’écrit : 

F = mx'\t) ; (6) 

l’équation (6) est une équation différentielle linéaire du 
deuxième ordre (il y a une dérivée seconde) ; la 
résoudre consiste à trouver l’équation x(f) du mouve¬ 
ment de la particule. 

• Remarque : La solution générale d’une équa¬ 
tion différentielle fait apparaître des constantes arbi¬ 
traires. Quand on se pose un problème déterminé (par 
exemple en mécanique), les données du problème 
imposent des conditions aux constantes, qui peuvent 
alors être calculées. Par exemple l’équation (6) peut 
être conditionnée par : 

1 - au temps f=0, le mobile est à l’origine du 
repère, c’est-à-dire qu’on doit avoir x(0) = 0 ; 

2 - au temps t= 0, la particule est immobile, 
c’est-à-dire que sa vitesse initiale v 0 = x'(0) = 0. 

Avec ces deux conditions, l’équation (6) admet pour 
solution la fonction : 

x(t)=±yt 2 . (7) 

Si l’on avait posé comme conditions : x(0) = x 0 y 0 
et v(0) = v 0 , la solution de (6) s’écrirait : 

x(t) = ^yt 2 +Vot +x 0 . (8) 

Lorsqu’on pose de telles conditions, appelées condi¬ 
tions initiales, et si la variable de la fonction y = f(x) 
cherchée appartient à un espace métrique normé 
( espace de Banach, voir pp. 106 et 107), il est possible 
de démontrer que l’équation différentielle proposée a 
une solution unique. Cette démonstration se fait par 
référence à un théorème dit théorème du point fixe de 
Picard et Banach, que nous n’énoncerons pas ici. 

Résolution des équations différentielles. 

La théorie des équations différentielles est une partie 
difficile de l’analyse, qui fait appel à de nombreux 
développements techniques et aussi à des considéra¬ 
tions générales abstraites qui dépassent le niveau de 
cet ouvrage. L’étude des propriétés des solutions 
d’une équation différentielle au voisinage d’une valeur 
x 0 de la variable ou dans de grands domaines fait 
intervenir d’importants théorèmes, respectivement dits 
locaux et non locaux que nous ne pouvons expliquer 
ici. Le lecteur trouvera, pp. 157-158, l’exposé des 
méthodes classiques d’intégration des équations diffé¬ 
rentielles du premier ordre (équations homogènes, 
équations linéaires) et du second ordre. 


Géométrie différentielle. 

Généralités. 

Pages 150-152, nous avons étudié les propriétés 
générales des courbes et des surfaces, et en particu¬ 
lier leur courbure, en utilisant la dérivée y' de la 
fonction y qui les représente. Cette application du 
calcul différentiel à la géométrie constitue la géométrie 
infinitésimale. 

Un problème particulièrement intéressant est l’étude 
des propriétés d’une surface courbe au voisinage d’un 
de ses points ou d’un de ses éléments caractéristiques. 
Les méthodes de la géométrie infinitésimale tradition¬ 
nelle sont insuffisantes pour traiter ce genre de ques¬ 
tions, et les mathématiciens ont dû créer une nouvelle 
théorie appelée géométrie différentielle. C’est une 
branche hautement spécialisée des mathématiques, 
que nous ne pouvons pas décrire ici, mais à propos de 
laquelle nous indiquerons quelques idées générales. 

1 - La géométrie différentielle peut être métri¬ 
que ou projective. Sous sa forme métrique, elle est liée 
à la mesure des distances et des angles et, d’une 
manière générale, aux propriétés laissées invariantes 
par un déplacement. Les propriétés invariantes pour la 
transformation projective générale sont étudiées par la 
géométrie différentielle projective. 

2 - Un point M, appartenant à une courbe C, 
plane ou gauche, est défini, dans l’espace IR 3 ordinaire, 
par ses trois coordonnées (x, y, z). L’équation d’une 
courbe C est alors de la forme, t étant un paramètre : 

x = f(t) -, y = g(t) ; z = h(t), (1) 
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FONCTIONS ANALYTIQUES 



Louis de Lagrange (1736-1813), mathématicien 
français qui fut, avec Euler, le plus grand mathéma¬ 
ticien du XVIII e siècle. On lui doit d’avoir créé le 
calcul des variations (1762), la mécanique analyti¬ 
que (1788) et la théorie des fonctions analytiques 
(1797-1799). (Gravure de Rados, d’après Bosio.) 


et la longueur ds d’un arc de courbe au voisinage du 
point A4(x, y, z) est donnée par : 

ds 2 = dx 2 + dy 2 + dz 2 . (2) 

3 - Étant donné deux points A4 ^ et A4 2 de la 
courbe C, voisins du point A4, on appelle plan oscilla¬ 
teur de C en M la position limite vers laquelle tend le 
plan MM : M 2 lorsque M 1 tend vers M 2 . Le cercle 
MM 1 M 2 devient alors le cercle osculateur ou cercle de 
courbure en M. 

4 - Une surface S peut être définie à l’aide de 
deux paramètres t et u par les équations : 

x — f{t, u) ; y = g(t, u) ; z — h(t, u). (3) 

Une courbe C sur la surface S est définie par une 
équation de la forme v{u). En calculant dx, dy et dz 
dans (3) et en portant leur valeur dans (2), on obtient : 

ds 2 = EdF + 2 Fdfdu + Gdt/ 2 , (4) 

E, F, G étant des coefficients. Le second membre de 
(4) est appelé la première forme quadratique de la 
surface S. On appelle deuxième forme quadratique 
l’expression 

D dt 2 + 2 D'dtdu + D" du 2 , (5) 

dans laquelle D, D' et D" sont des coefficients. Si l’on 
impose que, en chaque point A4 G C, le plan osculateur 
de C coïncide avec le plan tangent à la surface S, 
l’expression (5) est nulle et l’équation : 

Ddt 2 + 2D'dtdu + D" du 2 = 0 (6) 

définit une courbe appelée courbe asymptotique. 

Des relations entre les six coefficients E, F, G, D, D', 
D" on peut tirer diverses conclusions quant à la forme 
de la surface considérée. 

5 - Une section d’une surface par un plan conte¬ 
nant la normale à la surface au point M est une section 
normale ; la courbure de la section obtenue est la 
courbure normale. Les tangentes aux sections sont 
appelées directions principales ; les courbes de la 
surface S tangentes en chaque point aux directions 
principales sont appelées lignes de courbure de la 
surface. 

6 - En chaque point M d’une surface S, il existe 
une courbe dont le plan osculateur contient la normale 
en A4 à la surface. Une telle courbe est appelée une 
géodésique : la plus courte distance entre deux points 
A et B d’une surface S est la géodésique passant par A 
et B (sur une sphère, les géodésiques sont toutes des 
grands cercles de la sphère). 

A la notion de géodésique sont liés des invariants 


géodésiques (courbure géodésique, torsion géodé¬ 
sique). 

7 - Les notions précédentes — qui peuvent être 
représentées par des constructions dans l’espace à 
trois dimensions — peuvent être généralisées dans 
l’espace !R n . Appelons point un vecteur à n composan¬ 
tes (x 1f x 2 ,..., x n ) ; une courbe dans U n est alors définie 
par n équations paramétriques : 

x, = f,(t):, x 2 = f 2 (t) ; ... ; x n =f n (t ); (7) 

et une surface dans U n par n équations biparamétri¬ 
ques : 

x 1 = f,(t, u) ; x 2 = f 2 (t, u) ; ...; x n = f n (t, u) ; (8) 
la distance ds sur une surface S est définie par : 
ds 2 = E dt 2 + 2 Fdtdu + G du 2 , EG - F 2 > 0 . (9) 

Dans ce cas, la définition des longueurs et des 
angles, des géodésiques, des courbures, etc., fait 
intervenir les coefficients E, F, G. On ne peut plus faire 
de « dessins » pour représenter figurativement ces 
« points >> et ces « surfaces », qui sont des êtres mathé¬ 
matiques abstraits, abordables uniquement par le cal¬ 
cul. La géométrie correspondante est alors appelée 
géométrie riemanienne. 

Remarques historiques. 

C’est Bernoulli qui inventa, en 1697 (dans une lettre à 
Leibniz), la notion de géodésique , plus court chemin 
d’un point à un autre sur une surface donnée (si la 
surface est plane, la géodésique est la droite de la 
géométrie classique qui passe par ces deux points ; 
sinon, c’est une courbe dont il faut déterminer l’équa¬ 
tion). Les équations des géodésiques ont été établies, 
pour toutes sortes de surfaces, par Euler et Lagrange 
entre 1770 et 1780, et c’est à Monge qu’on doit le 
concept de ligne de courbure et de courbe asymptoti¬ 
que (voir ci-dessus même page, équation n° 4). Les 
problèmes de courbure ont été approfondis par des 
disciples de Monge : Charles Dupin ( Développements 
de géométrie, 1813; Applications de géométrie et de 
mécanique, 1822) et Meusnier. 

La théorie moderne des surfaces, qui est le point de 
départ de la géométrie différentielle, a été inaugurée 
par Gauss, qui définit les deux formes quadratiques 
fondamentales (voir même page, équation n° 4) et la 
notion de courbure totale et qui établit les équations 
fondamentales de la théorie des surfaces (vers 1840). 
Ces questions ont été approfondies par divers disci¬ 
ples de Monge, dont Barré de Saint-Venant (1846) et 
O. Bonnet (1867 : unicité de la surface définie par des 
formes quadratiques fondamentales données). 

La géométrie différentielle moderne remonte aux 
travaux de Riemann (1854, publiés en 1868, après sa 
mort) sur les hypothèses qui sont à la base de la 
géométrie. Ses idées ont imposé aux mathématiciens 
de mettre au point la théorie des formes différentielles 
quadratiques (Beltrami, Christoffel, Lipschitz) ; on par¬ 
vient ainsi aux travaux d’Enneper, de Schwarz, de 
Bonnet, de Darboux, de Bianchi, de Poincaré (Sur les 
courbes définies par une équation différentielle, 
1881-1886) et de Sophüs Lie (1888-1896). 

La théorie de la géométrie projective différentielle a 
été surtout développée au XX e siècle, avec les travaux 
de Wilczynski (1908), Fubini, Terracini, Bompiani, 
B. Segre, Godeaux, Villa, Vranceanu, Levi-Civita, etc. 
La géométrie différentielle globale (C. Ehresmann, 
S. Chem. A. Lichnerowicz) se rattache à la topologie. 


FONCTIONS D'UNE VARIABLE COMPLEXE 
ET THÉORIE DES FONCTIONS ANALYTIQUES. 

Fonctions de variable complexe. 

Coup d'œil historique. 

Lorsqu’on commença à s’intéresser à la notion de 
fonction, c’est-à-dire à la fin du XVII e siècle et au début 
du XVIII e , les mathématiciens eurent la « curiosité » 
d’examiner ce qui se passait lorsque la variable réelle x 
était remplacée par une variable imaginaire z (on ne 
disait pas encore « complexe »). Ainsi, dès 1702, Leib¬ 
niz et Jean Bernoulli n’hésitent pas à parler du logari¬ 
thme d’un nombre imaginaire, c’est-à-dire de la fonc¬ 
tion Ig z pour z complexe. A vrai dire, en bons mathé¬ 
maticiens, ils se méfièrent d’abord de leur intuition et 
discutèrent longuement sur la validité de cette généra¬ 
lisation. Comment, par exemple, définir le logarithme 
de i 2 , quelle que soit la base choisie ? En effet, i 2 = - 1, 
et la fonction logarithme n’est définie que pour une 


variable positive : mais qu’est-ce qu’un nombre 
complexe « positif » ? La discussion dura cinquante 
ans: entre Leibniz et Bernoulli jusqu’en 1712, entre 
Bernoulli et Euler jusqu’en 1726, entre Euler et D’Alem- 
bert jusqu’en 1747. Vers 1750, Euler clarifia la question 
et montra que tout nombre, réel ou, imaginaire, possé¬ 
dait une infinité de logarithmes, tous imaginaires sauf 
un (lorsque le nombre est positif). 

L’existence de fonctions d’une variable complexe 
implique qu’on puisse les étudier, et, pour cela, qu’on 
puisse calculer leurs dérivées successives. On peut 
être tenté d’appliquer aux fonctions d’une variable 
complexe les lois démontrées pour les variables réel¬ 
les. Nous avons vu que le critère de dérivabilité 
d’une fonction d’une variable réelle était l’existence 
d’une limite finie pour le rapport Ay/Ax de l’accroisse¬ 
ment de la fonction à l’accroissement de la variable 
lorsque ce dernier tend vers zéro. Le problème se pose 
donc de rechercher la limite de Ay/Az quand Az—>0, 
pour z complexe. Or il se trouve que les fonctions 
d’une variable complexe qui ne sont pas dérivables 
sont bien plus communes que celles qui sont dériva¬ 
bles : il est donc capital de définir la dérivabilité de la 
fonction f(z) pour une valeur z 0 de la variable 
complexe z: si la fonction admet une dérivée pour 
z = z 0 ou sur un intervalle [a, b] de valeurs de z, elle est 
dite régulière ou encore analytique, terme introduit par 
Lagrange en 1797 ( Théorie des fonctions analytiques). 

Attardons-nous un instant sur la définition lagran¬ 
gienne d’une fonction analytique : pour l’illustre 
mathématicien, une fonction est analytique si elle peut 
se représenter par la somme d’une série de puissances. 
Dès 1772, Lagrange avait compris l’importance de la 
formule de Taylor (1715, voir p. 115) : en appelant h 
un accroissement — qui peut devenir infiniment petit 
— de la variable x, on montre que : 

f(x + h ) = f (x) + hf '(x) + 

+ 7Tjr n*)+ §T r "(*) + ” • C) 

(n! = 1 x 2 x 3 x ••• x n). Peut-on représenter par un 
tel développement une fonction d’une variable 
complexe ? Lagrange était gêné pour résoudre ce 
genre de question, car, soucieux de rigueur, il ne 
voulait pas entendre parler de la convergence d’une 
série, la notion de limite n’étant pas, à son époque, 
convenablement définie. C’est Cauchy (à partir de 
1814) qui rendit possible l’étude des fonctions d’une 
variable complexe en introduisant sa définition célèbre 
de la convergence et qui mit au point le calcul des 
résidus, à l’aide duquel il donne une méthode de 
détermination des intégrales de fonctions analytiques 
le long de contours fermés (voir la définition d’une 
intégrale curviligne p. 123). Enfin Cauchy introduit la 


André Lichnerowicz, mathématicien français (né 
en 1915). Ses travaux les plus importants concer¬ 
nent la physique mathématique, la relativité, la 
théorie des champs, la géométrie différentielle. 
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notion de fonction monogène dans un domaine (voir 
ci-dessous) et montre la relation qui existe entre le fait, 
pour une fonction, d’être analytique (c’est-à-dire repré¬ 
sentable par une série de puissances) et dérivable en 
un point. 

Les idées de Cauchy ont été précisées et approfon¬ 
dies par A. Laurent (la « série de Laurent », 1831) et 
Victor Puiseux (1850). A partir de cette époque, indé¬ 
pendamment des théories de Cauchy, Riemann 
reprend la théorie des fonctions analytiques (1851), qui 
devient plus générale et plus rigoureuse avec les 
travaux de Weierstrass (vers 1872-1876), Méray, Caso- 
rati, Émile Picard (1879) et Poincaré. 

Au XX e siècle, la théorie des variables complexes a 
pris un nouvel essor, avec les travaux d’Émile Borel, 
qui a montré que la classe des fonctions monogènes 
est plus étendue que celle des fonctions analytiques, 
de P. Montel, de Goursat, de Looman, de Men’àov, de 
H. Bohr, de Pompeiu (notion de dérivée aréolaire, 
1912). Les fonctions polygènes ont été définies et 
étudiées par de nombreux mathématiciens, en particu¬ 
lier par ceux de l’École roumaine (vers 1930). De 
nouveaux problèmes ont été soulevés à propos des 
fonctions dites entières, des familles de fonctions, de 
la représentation des fonctions analytiques, des fonc¬ 
tions périodiques, multiformes et à plusieurs variables. 


Définitions et exemples. 

Considérons le corps C des complexes, dont l’image 
est un plan, comme on l’a expliqué p. 56 et soit z G C 
une variable complexe, et f(z) G C une fonction de z, 
c’est-à-dire une application de C dans C. Appelons E 
le domaine de définition de la fonction, c’est-à-dire la 
partie de l’ensemble C à laquelle doit appartenir z pour 
que la fonction f(z) soit définie (E C C). Nous aurons 
présent à l’esprit le mode de représentation des 
nombres complexes à l’aide du plan d’Argand-Cauchy, 
et nous parlerons indifféremment de la valeur z 0 de la 
variable z ou du point z 0 du plan complexe. 

• Dérivée en un point z 0 G E. Si, pour e > 0, il 
existe un nombre 8 > 0, tel que la relation : 

I z - z 0 1 < S , z ji z 0 (2) 

implique : 

I 1(Z)~ f(Z 0 ) I _ 

L-< £ 

z - Z o | 

le nombre L est la limite du rapport 
[7(z) - f(z 0 )]/(z- z 0 ) quand z - z 0 tend vers 0, z 0 G E ; 
c’est la dérivée de la fonction f(z) pour la valeur z= z 0 
de la variable, et nous l’écrirons f (z 0 ). On peut préci¬ 
ser, si nécessaire, £(z 0 ) pour indiquer que z 0 G E. Si F 
est une partie de E et z 0 un élément de F, alors 
l’existence d’une dérivée f^(z) entraîne celle d’une 
dérivée £(z). 

• Dérivée dans un ensemble E. Si une fonction 
f(z) est dérivable en tout point de l’ensemble E, elle est 
dite dérivable dans E. 

• Fonction analytique (= régulière). Soit G un 
ensemble ouvert dans C, contenant le point z 0 et les 
points du cercle |z-z 0 |<r (c’est aussi ce qu’on 
nomme un domaine) : une fonction f(z) dérivable en 
tout point d’un domaine G est dite analytique dans G et 
sa dérivée peut être désignée par f'{Z), sans indiquer 
l’ensemble G. 

Une fonction est dite analytique (= régulière) en un 
point z 0 s’il existe un domaine G contenant z 0 dans 
lequel elle est définie et analytique. 

• Fonction monogène dans un domaine G. La 
définition de la dérivée en un point z 0 de la fonction 
f{z) suppose que la distance z — z 0 entre deux points 
voisins diminue indéfiniment, c’est-à-dire que z—> z 0 ; 
elle ne tient pas compte du chemin suivi par z à 
l’intérieur de G pour se rapprocher de z 0 . S’il existe, en 
chaque point de G, une dérivée pour f(z), quel que soit 
le chemin suivi par z pour se confondre avec z 0 , la 
fonction est dite monogène dans G. Si, en outre, la 
fonction f(z) est représentable par une série entière de 
la variable autour de chaque point z 0 GG, elle est 
analytique : Émile Borel a montré que monogénéité et 
régularité (= analyticité) n’étaient pas des propriétés 
équivalentes. La classe des fonctions monogènes est 
plus étendue que celle des fonctions analytiques. 

• Exemples. 

— La fonction f(z) = z, avec z G C est analyti¬ 
que partout dans C ; on a en effet, pour tout z 0 G C : 

f(z)- f (z o) = z - z o = 1 

Z — Z 0 Z — Z 0 ' 

Donc f(z) = 1 pour toutes les valeurs de z G C. 

— Soit z = x + yi, et appelons z = x —yi le 



Ernst Eduard Kummer (1810-1893), mathématicien 
allemand dont le nom est resté attaché à la théorie 
des corps et à la théorie des nombres. On lui doit la 
création des idéaux de Kummer qui jouent par 
rapport aux nombres dits algébriques le rôle de 
PGCD en arithmétique élémentaire. 


conjugué de z. La fonction f(z) = z s’écrit donc : 

f(z) = x-y i. (4) 

Considérons un point z 0 dans le plan complexe et 
soit G une partie de C contenant z 0 et représenté par 
une demi-droite quelconque d’origine z 0 . Pour tout 
zG G on peut montrer que : 


f(z)~ f(Z p) Z - Zq 
Z - Zo Z - Zo 


- 2 arg (z - z 0 ) 


(5) 


(z - z 0 est le conjugué de z - z 0 ; arg est l’abréviation 
d’ argument, nom de l’angle <p dans la représentation 
trigonométrique des nombres complexes expliquée 
p. 56. 

Donc, en vertu de (5), pour tout z 0 G G on a : 

f'(z 0 ) = -2arg(z-z 0 ) (6) 

et f(z) est analytique dans G. 

Mais si G est un ensemble contenant deux 
demi-droites différentes issues de z 0 , la même 
relation (5) montre que f(z) n’est pas dérivable dans 
G : ce n’est donc pas une fonction analytique dans G 
(ni, a fortiori, dans C). 

• Remarques : 

1 - Si deux fonctions f{z) et g(z) sont dérivables 
dans un domaine E, on peut leur appliquer les règles 
de dérivation des fonctions d’une variable réelle. 

2 - En particulier, le polynôme complexe : 

P(x) = a 0 z n + a, z "- 1 + ••• + a n (7) 

a pour dérivée : 

P(x) = na 0 z n_1 + (n - 1) a^ z n 2 -f ••• -h a n _., . (8) 

3 - Comme dans le cas d’une variable réelle, on 
peut définir la différentielle dy d’une fonction y = f(z) 
pour z complexe : 


dy = f(z) dz . 


(9) 


4 - Soit y = f(z) = u + \v une fonction dérivable 
pour z = z 0 =x 0 + iy 0 , (x 0 ,y 0 GlR), u et v étant des 
complexes de la forme x + iy et que nous écrirons 
u(x, y) et v(x, y). On démontre que, en tout point z 0 où 
la dérivée / = f(z 0 ) existe on a la relation : 


1 9 u 0 v 
0x 0y ’ 

0 V _ du 
0X 0y 


( 10 ) 


(il s’agit de dérivées partielles). Les relations (10) sont 
appelées conditions de Cauchy-Riemann : elles garan¬ 
tissent la dérivabilité d’une fonction f(z) en un point z 0 . 


FONCTIONS ANALYTIQUES 

Concepts fondamentaux. 

Il ne peut être question d’étudier ici, même succinc¬ 
tement, la théorie des fonctions analytiques et non 
analytiques d’une variable complexe. Nous nous limite¬ 
rons à signaler quelques concepts importants liés à 
cette théorie. 

Caractères des fonctions de variables complexes. 

Nous avons déjà défini les fonctions monogènes et 
les fonctions analytiques (ou régulières). A partir de 
ces concepts, de nouvelles définitions peuvent être 
données, qui décrivent les propriétés des fonctions 
d’une variable complexe. 

— Une fonction est dite holomorphe dans un 
domaine E si son intégrale curviligne prise le long d’un 

contour fermé C, soit j c f{z)dz, est nulle. Si elle 

prend une fois au plus chacune de ses valeurs, elle est 
dite univalente ; si elle prend p fois au plus chaque 
valeur, elle est dite multivalente d’ordre p. On montre 
que le domaine d’une fonction analytique multivalente 
peut être découpé en sous-domaines où elle est univa¬ 
lente (F. Marty). 

On montre (Goursat) qu’une fonction monogène en 
chaque point d’un domaine est holomorphe dans ce 
domaine. 

— Les conditions de monogénéité d’une fonc¬ 
tion ont été étudiées par Men’èov, Rademacher, Fedo- 
rov. En particulier, si une fonction est monogène, elle 
vérifie les conditions de Cauchy-Riemann (voir équa¬ 
tion (10)); mais la réciproque n’est pas vraie : une 
fonction analytique n’est pas nécessairement mono¬ 
gène. 

— Pompeiu a introduit la notion de dérivée 
aréolaire d’une fonction f(z) = u(x, y) + iv(x, y), avec 
z = x + iy. Par définition, la dérivée aréolaire de f(z), 
D f 

notee —— a pour valeur : 

D w 

Df 1 + j + 

Dw~2\_dx 0y + ' \9y a* 

(on remarque que la quantité entre crochets contient 
les dérivées partielles des conditions de Cauchy- 
Riemann). La dérivée aréolaire d’une fonction mono¬ 
gène est nulle (comparer à : « la dérivée d’une fonction 
constante est nulle ») ; si Df/Dw^0, la fonction f(z) 
est dite polygène. 

— Une fonction de variable complexe f(z) est 
une application de C dans lui-même, ou, plus exacte¬ 
ment, une application d’un domaine E C C dans un 
domaine F C C : la variable z est représentée géométri¬ 
quement par les points de la portion E du plan 
complexe, et la fonction f(z) par les points de la portion 
F du même plan (voir p. 56 la représentation géomé¬ 
trique des nombres complexes). Si, pour une valeur 
z = a de la variable, la fonction f(z) devient infinie, le 
point représentatif de a est appelé pôle de la fonction 
f(z). Une fonction qui admet un ou plusieurs pôles 
dans un domaine E est dite méromorphe dans ce 
domaine : sinon elle est holomorphe (une fonction 
holomorphe ne prend donc que des valeurs finies). 

Points singuliers. 

• Point singulier essentiel. Un point ou une 
fonction f{z) n’est pas monogène (c’est-à-dire une 
valeur z 0 de la variable pour laquelle la fonction n’est 
pas monogène) est appelé point singulier essentiel. 
Deux cas sont alors possibles. 

1 - Dans un cercle de centre z 0 et de rayon etel 
que lz —z 0 l<e, il n’existe aucun autre point singu¬ 
lier : le point singulier essentiel est dit isolé. 

2 - Dans ce cercle de centre z 0 , il existe d’autres 
points singuliers essentiels : on est en présence d’un 
ensemble fermé de points singuliers. 

Précisons cette notion dans le cas où il s’agit d’une 
fonction analytique. Une telle fonction est monogène 
pour z = z 0 si on peut la développer en série de Taylor 
au voisinage de z 0 . On pourra donc écrire, dans ce cas, 
d’après l’équation (1) page 124 : 

L 2 

f(z 0 + h) = f (z o) + hf'(Zo) + —f"( z °) + “' (2) 

Le point z 0 est alors un point régulier. Si la 
décomposition (2) n’est pas possible, le point z 0 est un 
point singulier. 

• Théorème de Picard (1879). Dans le voisinage 
d’un point essentiel isolé, une fonction prend une 
infinité de fois toute valeur, à l’exception de deux au 
plus. Autrement dit il existe une ou deux valeurs 7, et f 2 
que la fonction f(z) ne prend pas dans le voisinage de 
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FONCTIONS ANALYTIQUES 


z 0 si celui-ci n’est pas un point essentiel : on les 
nomme valeurs exceptionnelles. 


Interprétation géométrique. 

Tout ce qui précède est abstrait. Nous allons expli¬ 
quer, sur quelques exemples classiques, comment 
étudier une fonction w = f(z) d’une variable complexe. 
Pour cela, nous ferons appel à la représentation géo¬ 
métrique des nombres complexes (voir p. 56) et à leur 
expression trigonométrique à l’aide du module r et de 
l 'argument cp. Rappelons les formules principales, a et 
b étant des nombres réels : 

z = a + b i = r(cos <p + i sin <p), (3) 


r = Va 2 + ô 2 ; cos <p =-; sin <p = -. (4) 

Dans un plan rapporté à deux axes rectangulaires Ox 
et Oy, un nombre complexe z est représenté par un 
point M de coordonnées x = a, y = b ; le module r est 
la longueur du vecteur OM ; l’argument (p est l’angle 
du vecteur OM avec l’axe des x. 


• L’application E— f —> F. Pour étudier géométri¬ 
quement une fonction analytique w = f(z), nous trace¬ 
rons côte à côte deux repères xOy et uOv. Les valeurs 
de la variable z pour laquelle la fonction est définie 
constituent un domaine E du plan xOy (ce sont tous les 
points d’une surface E de ce plan) ; les valeurs corres¬ 
pondantes de la fonction w = f(z) ont pour image les 
points d’un ensemble F du plan uOv. La variable z et la 
fonction f(z) s’écriront : 


J z = x + iy ; 

1 w = f(z) = u + \v. 


(5) 



I - Variable z = x -F iy. Il - Fonction w - f (z) = u + iv. 


I - Domaine de définition de la fonction w = f(z). 
Chaque point MŒ E est l’image d’une valeur particu¬ 
lière de la variable z, de module r et d’argument «p. 

II - Domaine des valeurs de la fonction w= f(z). 
Chaque point NŒ F est l’image d’une valeur w de la 
fonction E—L^> F, de module s et d’argument ifj. 
L’application que définit la fonction w= f(z) trans¬ 
forme le domaine E du plan complexe dans le 

domaine F du même plan. 


• Signification géométrique de la dérivée 
w' = f{z). Considérons deux points voisins dans E, M 0 
et Mq, et les points correspondants N 0 et Nq dans F. Ces 
points correspondent aux valeurs suivantes de la varia¬ 
ble et de la fonction : 


I M 0 correspond à z = z 0 ; 

M' 0 correspond à z = z 0 + Az ; 

N q correspond à w — w 0 = f(z 0 ) ; ' ' 

Nq correspond à w 0 + Aw = f(z 0 + Az). 

Les accroissements Az et Aw de la variable et de la 
fonction sont, en valeur absolue, les mesures des 
segments M 0 M' 0 et N 0 Nq. Plus précisément : Az et Aw 
sont des nombres complexes de modules I M 0 Mq I et 
\N 0 Nq\. Dès lors, puisque par définition, la dérivée 
f(z 0 ) de la fonction w au point z= z 0 est : 


f'(Zo) 


lim 


A w 


o Az ’ 


(7) 


le module I f' (z 0 ) I de la dérivée au point z = z 0 est la 
limite : 


\f'(z 0 )\= lim 

M 'g—. Mq 


l/Vo Nj I 

I Mo /W'ol 


lim 

AZ-.0 


A w 
Az 


( 8 ) 


En d’autres termes, la dérivée f(z 0 ) caractérise, par 
son module I f(z 0 )l, la variation des dimensions linéi¬ 


ques au point z = z 0 dans la transformation de E en F 


par la fonction f(z). Si, par exemple : 

f(z) = z 3 + z 2 + 1 , (9) 

la dérivée est : 

f\z) = 3 z 2 + 2 z = z(3 z + 2). (10) 

Au point z = 1 + i, cette dérivée vaut : 

f(1 4- i) = (1 + i) (5 + 3 i) = 2 + 8 i . (11) 

Son module est : 

I f(1 + i) I = V4 + 64 = V68 = 2 VÏ7 . (12) 


Donc au point M 0 image de z = 1 + i, les dimensions 
linéiques sont multipliées par 2 VÏ7 dans l’application 
qui transforme E en F selon (9). 

— Examinons maintenant la signification géo¬ 
métrique de l’argument de la dérivée au point z = z 0 , 
soit arg f (z 0 ). Supposons que le point M' 0 tend vers M 0 
selon une courbe C E (arbitrairement tracée sur la 
figure ci-après). L’application EF, c’est-à-dire la 
fonction w = f(z), transforme la courbe C E du domaine 
E en une courbe C F du domaine F. On a : 

argument de Az = angle du vecteur M 0 Mq 

avec l’axe Ox = <p ; 

(13) 

argument de Aw = angle du vecteur N 0 Nq 

avec l’axe Ou = if/. 

L’angle des vecteurs M 0 Mq et N 0 Nq est égal à : 

(M 0 Mq, N 0 Nq) = il/ - (p = arg Aw - arg Az. (14) 

On montre, en étudiant les règles du calcul sur les 
nombres complexes, que l’argument d’un quotient z/z' 
est égal à la différence des arguments du numérateur 
et du dénominateur, soit arg z —arg z'. Donc, ici : 

A w 

arg Aw -arg Az = arg —. (15) 

Quand Az^O, M 0 M' 0 tend vers la tangente en M 0 à 
la courbe C E et N 0 N' 0 tend vers la tangente en N 0 à la 
courbe C F , et 

A w 

arg —arg f\z). (16) 

En d’autres termes : l’argument de la dérivée f(z 0 ) 
est l’angle dont a tourné la tangente à la courbe C E 
dans la transformation E F. 

• En résumé, se donner une fonction w = f(z) 
d’une variable complexe, c’est transformer le domaine 
E en un domaine F; les caractéristiques de cette 
transformation sont les suivantes : 

1 - un point M au voisinage du point M 0 , image 
de la valeur z 0 de la variable, subit l’homothétie de 
centre M 0 et de rapport I f(z 0 ) I égal au module de la 
dérivée en z = z 0 , c’est-à-dire que la distance M 0 M 
devient, dans F, M 0 M x | f (z 0 ) I ; 

2 - le même point M ainsi transformé subit 
ensuite une rotation autour de z 0 d’angle arg f(z 0 ). 

Étant donné deux courbes C E et C' E , qui se coupent 
en Mq, elles sont transformées en deux courbes C F et 
C F , qui se coupent en N 0 = f(M 0 ). Les tangentes en M 0 
aux deux courbes tournent d’un angle égal à arg f'(z 0 ) : 
donc leur angle est conservé dans la transformation. 
On dit d’une telle transformation qui conserve les 
angles qu’elle est conforme. 


Exemples. 

• Fonction linéaire complexe. Soit la fonction 
de la variable complexe z : 

f(z)= w = a(z Zq) 4- b , (17) 

où a 0, z 0 et b sont des nombres complexes. Au 
point z = z 0 , on a: 

J w(z 0 ) = w 0 =b-, (18 x 

mz 0 ) = a. ' ’ 


D’où A w = w - w 0 = a(z — z 0 ) = a Az. On a donc, en 
notant les modules par deux barres verticales : 


1 Awl = I a 1 x | Az 1 

(19) 

et 


arg Aw = arg a + arg Az , 

(20) 

à 2 /ctt près. 



Conclusion: la fonction w = f(z) transforme tout 
cercle de centre z 0 et de rayon I Az I «s p par une 
homothétie de centre z 0 et de rapport I a I (module de la 
dérivée), suivie d’une rotation autour de z 0 d’angle 
arg a (argument de la dérivée d’après (20)) ; le centre z 0 
est changé en w 0 par une translation. 




Signification géométrique du module et de l’ar¬ 
gument de la dérivée f'(z 0 ) d’une fonction w = f(z) au 
point z = z Q , z étant une variable complexe. 

I - Dans le domaine E de définition de la fonction, 
Az est un nombre complexe représentant l’accrois¬ 
sement de la vari able au point z= z 0 , il a pour image 
le vecteur M 0 M £ de grandeur égale au module I Azl 

de Az et d’argument (p = arg Az. 

II - Dans le domaine F des valeurs de la fonction 
w, A w est un nombre complexe représentant 
l’accroissement de la fonctio n au point z = z 0 ; il a 
pour image le vecteur N 0 N^, de grandeur égale au 

module I Awl de Aw ef d’argument i{/ = arg Aw. 


• Fonction w = ~. Tout point z du plan 

complexe est représenté par un point w du plan 
complexe. Les points z = 0 et z = oo sont respective¬ 
ment transformés en w = oo et w = 0. L’application 
w = 1/z est donc bijective (voir p. 21) et conforme. 


• Fonction w = z n (n > 1). On peut démontrer 
aisément que, pour argz<Tr/n, on a: 

I w I = I z I ° ; arg w = n arg z (21) 

(les barres verticales désignent le module de w et de z). 
Si le domaine E est l’angle <p = arg z tel que : 

— a: < (p < ol — , (22) 


la fonction transforme E en F, dont l’image est l’angle 
iJj = arg w tel que : 

— na < if/ < na . (23) 

Donc la fonction w = z n applique l’intérieur de 
l’angle <p sur l’intérieur de l’angle ifj du plan complexe ; 
l’application est bijective. 

• Fonction w = e z . La fonction s’écrit aussi, 
avec z = x + iy : 

W = e X+îy = e X( CQS y + j gjp y) (24) 

et l’on a : 


I e*l = e x ; arg e z = y + 2 k tt (k = 0,±1 ,...)• (25) 


Toute droite y = y 0 du plan complexe xOy se trans¬ 
forme en une ligne dont l’équation paramétrique est : 


dans le plan uOv. 


u = e x cos y 0 ; 
v = e x sin y 0 


(26) 


• Fonctions multivoques. Une fonction qui 
prend plusieurs valeurs pour une même valeur de la 
variable est dite multivoque ou multiforme. On la 
représente alors par plusieurs surfaces superposées, 
constituant une surface riemanienne. 

• Intégration des fonctions analytiques. Les 
fonctions analytiques sont intégrables au même titre 
que les fonctions d’une variable réelle, avec, bien 
entendu, des restrictions et des définitions appro¬ 
priées. Pour ces questions très importantes, mais très 
techniques, se reporter aux traités classiques. 
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TOPOLOGIE 


GÉNÉRALITÉS 

De quoi s'agit-il ? 

Le mot « topologie ». 

Au début du XIX e siècle, deux branches des mathé¬ 
matiques se disputent le titre de « branche reine » : la 
géométrie et l’analyse. La première n’est autre que la 
bonne vieille géométrie euclidienne, grossie de la 
géométrie projective créée par Poncelet en 1822 (voir 
p. 87), munie de cet outil merveilleux qu’est la 
géométrie analytique : elle a déjà 2 000 ans d’âge. La 
seconde est une science neuve, qui a un peu plus d’un 
siècle d’existence ; elle comporte alors deux grandes 
théories, le calcul infinitésimal et la théorie des fonc¬ 
tions d’une variable réelle. 

En apparence, les objets de la géométrie et de 
l’analyse sont bien différents : les figures, planes ou 
gauches, dans un cas, les infiniment petits et les 
fonctions dans l’autre. Les modes de raisonnement 
diffèrent aussi. Toutefois, les deux branches des 
mathématiques entretiennent une certaine correspon¬ 
dance : une fonction peut avoir pour image une 
courbe, une intégrale définie a pour image une surface, 
etc. ; inversement, la détermination de la tangente en 
un point d’une courbe est un problème géométrique 
qui peut être résolu par l’analyse (voir la signification 
géométrique de la dérivée, p. 113). 

Or, il se trouve que les mathématiciens se sont 
posé, tant au XVIII e siècle qu’au début du XIX e siècle, 
des problèmes de géométrie ou d’analyse qui font 
intervenir des concepts communs, ou du moins, des 
concepts traduisibles à la fois dans la langue des 
géomètres et dans celle des analystes. 

• Un exemple, la notion de « voisinage ». 

— En géométrie, on appelle, d’une manière 
intuitive, « voisinage » d’un point sur une surface une 
certaine région de cette surface autour du point consi¬ 
déré. Si la surface est un plan, le voisinage d’un point 
M du plan est constitué par « tous les points qui 
l’entourent » ; pour donner à la notion une définition 
plus conceptuelle, on dira, par exemple, que le voisi¬ 
nage d’un point M est constitué par tous les points 
compris à l’intérieur d’un cercle de centre M et de 
rayon r « très petit ». Mais l’expression « très petit » n’a 
rien de rigoureux et, physiquement, elle est très relative 
et très conventionnelle. Supposons que je choisisse, 
comme valeur du rayon limitant le « voisinage » du 
point M, r = 1 mm, et que je décide de dire qu’un point 
M’ est voisin de M si la distance MM' est inférieure à 
1 mm : que dire des points du cercle, pour lesquels on 
a MM' = 1 mm ? Sont-ils voisins de M ? 

Autre exemple : soit un point P tel que MP < 1 mm, 
donc tel que P soit voisin de M au sens grossier défini 
plus haut ; soit un autre point Q tel que PQ < 1 mm : je 
peux dire que Q est voisin de P. Mais est-il voisin de 
M ? Pas obligatoirement. En géométrie, les voisins de 
nos voisins ne sont pas nécessairement nos voisins. 

Les quelques remarques nous font pressentir que la 
définition du voisinage d’un point sur une surface est 
une tâche pleine d’embûches, et qu’il faudra bien 
soigner nos axiomes si nous voulons raisonner sur les 
voisinages. 

— En analyse, on peut aussi parler de voisi¬ 
nage : soit f A et f 2 deux valeurs (réelles) d’une fonction 
y = f[x), x étant une variable réelle ; nous dirons que 7, 
et f 2 sont deux valeurs voisines si certaines conditions 
(que nous n’avons pas à énoncer ici) concernant la 
différence f 2 - f A sont vérifiées. Appelons /W 1 et M 2 les 
points représentant les valeurs f A et f 2 de la fonction 
dans un plan xOy : si f, et f 2 sont voisines au sens de 
l’analyse, alors /Vf 1 et M 2 seront voisins au sens de la 
géométrie (à condition que nos systèmes d’axiomes 
définissant le voisinage soient bien choisis). 

• Plus généralement, de Leibniz à Cauchy en 
passant par Euler, les mathématiciens ont eu l’atten¬ 
tion attirée par des problèmes qui semblaient alors 


marginaux par rapport aux problèmes fondamentaux 
de la géométrie et de l’analyse et qui étaient principale¬ 
ment des problèmes d’apparence géométrique, faisant 
intervenir les notions de voisinage, de connexité, de 
dimension (la liste n’est pas limitative). Pour les résou¬ 
dre géométriquement, ils ont été conduits à faire usage 
de méthodes inhabituelles, et Leibniz a créé l’expres¬ 
sion Analysis situs (dans une lettre à Huygens, du 
8 septembre 1679) pour désigner le corps de doctrines 
traitant de ces problèmes. Le terme leibnizien signifie 
« analyse de position », ce qui souligne bien l’aspect 
géométrique des questions posées. 

• Le mot « topologie » a été créé en 1836 par le 
mathématicien allemand Listing, élève de Gauss, 
comme substitut à Analysis situs. Il désigne alors 
non pas un corps de doctrines bien constitué, mais 
l’ensemble des méthodes permettant de traiter les 
problèmes posés en Analysis situs, problèmes qui 
sont, en général, géométriques, mais qui peuvent être 
traduits en termes d’analyse. 

Entre 1840 et 1914 environ, le mot «topologie» 
désigne principalement l’étude des propriétés qui res¬ 
tent invariantes pour un certain type de transforma¬ 
tions appelées d’abord corrélations élémentaires (en 
1860, par l’astronome et mathématicien allemand 
Môbius), puis homéomorphismes (terme introduit 
dans les dernières années du XIX e siècle par Poincaré). 
(Voir ci-dessous, la définition et l’illustration de la 
notion d’ homéomorphie.) 

• Depuis le début du XX e siècle, des distinc¬ 
tions nouvelles sont apparues — et apparaissent 
encore, car la topologie est une branche très actuelle 
des mathématiques. 

1 - En son sens le plus vaste, la topologie est 
l’étude d’ensembles dans lesquels on a défini une 
certaine structure, appelée structure topologique, et 
caractérisée par un certain nombre d’axiomes ; une 
structure topologique est encore appelée une topolo¬ 
gie (ne pas confondre avec la topologie). Ces ensem¬ 
bles sont appelés des espaces topologiques ou encore 
des espaces munis d’une topologie (le mot « espace » 
étant pris au sens défini p. 46 et non au sens trivial 
d’espace géométrique ; toutefois l’espace géométrique 
est un espace particulier, dont les éléments peuvent 
être des points par exemple). 

2 - On distingue — depuis les années 1920/1930 
environ — la topologie générale, dite encore ensem- 
bliste ou analytique, et la topologie algébrique, appe¬ 
lée aussi combinatoire. Les problèmes les plus célè¬ 
bres de \’Analysis situs relèvent de la topologie combi¬ 
natoire ; la topologie générale concerne principale¬ 
ment des problèmes nés de la théorie des fonctions de 
variables réelles (mais, dans la mesure où ces fonc¬ 
tions peuvent avoir des images géométriques, la topo¬ 
logie générale peut traiter en particulier de problèmes 
géométriques, en rapport avec les idées de voisinage 
ou de connexité par exemple). 


Exemples simples de problèmes topologiques. 

• L’homéomorphie. Ce terme barbare recouvre 
une réalité dont il est aisé de donner une illustration 
concrète. 

— Considérons un morceau de fil élastique. 
Nous pouvons lui faire prendre les formes (arbitraires) 
suivantes : 



Chaque forme est une figure, c’est-à-dire un ensem¬ 
ble de points. Il est clair que, si l’on appelle a le point 
situé à l’un des bouts, b le point situé à l’autre « bout », 
et x un point quelconque sur le fil, une propriété telle 
que : 

« x est entre a et b » 

est vraie pour les formes I, L, J, M et S. La transforma¬ 
tion qui change la forme du fil en laissant invariantes 
des propriétés telles que la précédente (qui concerne 
la position relative des points de la figure) est appelée 
un homéomorphisme. 

— Soit maintenant la figure en forme de Y : 


b c 



a 


Il est impossible de passer de l’une des formes 
précédentes (I, L, J, M ou S) à la forme en Y sans 
sectionner le fil : les lignes telles que I et Y ne sont pas 
homéomorphes. Cela signifie, entre autres choses, 
qu’il existe au moins un point de la figure en Y qui n’a 
pas de correspondant dans la figure en I. Considérons 
en effet le point O où se rencontrent les trois branches 
du Y et appelons a, b et c les « bouts » de chaque 
branche. Le point O appartient à la fois aux trois 
branches Oa, Ob et Oc. Or, sur la figure en I, il n’existe 
aucun point qui appartienne à trois branches distinctes 
(un point x ne peut appartenir, au plus, qu’à deux 
branches xa et xb). . 

— Voici un exemple plus général. Traçons des 
figures diverses — segments de droite, cercles, trian¬ 
gles, etc. — sur une feuille de caoutchouc tendue ; puis 
déformons cette feuille en l’étirant, en soulevant certai¬ 
nes de ses parties, etc. Il est clair que certaines 
propriétés des figures ne vont pas se conserver après 
cette déformation : la longueur d’un segment, le fait 
pour tous les points d’un cercle d’être à la même 
distance du centre, etc. En revanche, si trois points a, 
b, c sont dans cet ordre sur l’une des figures avant la 
déformation, les points a', b', c'qui leur correspondent 
après la déformation sont dans le même ordre : la 
transformation conserve l’ordre des points ; de même, 
si deux segments se coupent sur la feuille initiale, ils se 
coupent encore après la déformation : l’intersection de 
deux segments est un autre invariant, etc. On peut 
donc dire que les figures déformées sont homéomor¬ 
phes aux figures initiales pour les invariants consi¬ 
dérés. 

— Il faut bien comprendre qu’on ne peut parler 
d’homéomorphisme que pour certains invariants seu¬ 
lement. Ainsi la déformation de la feuille de caout¬ 
chouc n’est pas un homéomorphisme pour la propriété 
« être parallèle à », ou pour les distances entre deux 
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points. Cela signifie que, pour parler d’homéomor¬ 
phisme entre deux ensembles de points X et Y, il faut 
d’abord définir sur X et sur Y certains caractères. On 
dit encore que l’on munit X et Y d’une structure 
topologique (ou, plus brièvement, d’une topologie). 
Nous verrons plus loin en quoi cela consiste. 

• Propriétés locales et propriétés globales. Une 
surface est un ensemble de points, que nous pouvons 
appeler espace au sens défini p. 46. Chaque 
surface possède des propriétés typiques, qui sont liées 
à sa nature et qu’on appellera topologiques (on pour¬ 
rait les déduire d’un système d’axiomes qui définirait la 
structure topologique de cet espace). Considérons, 
par exemple, la surface d’une sphère. Nous pouvons la 
ceindre d’un cercle élastique (équateur), qu’on peut 
réduire d’une façon continue jusqu’à ce qu’il se limite à 
un point (pôle). Soit maintenant la surface d’un tore (un 
pneu de bicyclette est un tore) : si nous l’entourons 
d’un cercle élastique, il nous est impossible de réduire 
ce cercle d’une manière continue jusqu’à ce qu’il ne 
soit plus qu’un point. Cette propriété (le cercle qui 
devient point) distingue l’espace sphérique de l’espace 
torique : c’est une propriété topologique. Nous disons 
que la sphère n’a pas la même topologie que le tore, 
quand on considère ces deux surfaces globalement. 

Voici une autre propriété topologique globale qui 
distingue la sphère d’un tore : je peux faire rouler une 
bille sphérique d’une infinité de façons ; en revanche 
un cerceau ne peut rouler que d’une seule manière. 
Voilà pourquoi on construit des roulements à billes, 
mais hon pas des « roulements à bagues ». Cette 
aptitude au roulement est une propriété topologique 
globale. 

Découpons maintenant un tout petit confetti sur une 
sphère et un autre sur un tore. L’un comme l’autre 
peuvent être assimilés à un petit morceau de plan : ils 
ont les mêmes propriétés topologiques, et on ne peut 
plus les distinguer. Autrement dit les propriétés locales 
(celles d’un confetti) d’une sphère et d’un tore sont les 
mêmes, alors que leurs propriétés globales sont diffé¬ 
rentes. 

Cette distinction n’est pas sans intérêt et peut être 
généralisée. Étant donné un espace topologique (c’est- 
à-dire un ensemble dans lequel on a défini une topolo¬ 
gie), une propriété ou une théorie qui est vraie aussi 
bien pour l’espace tout entier qu’au voisinage de ses 
points relève de la topologie générale. Si elle n’est pas 
applicable aux voisinages, elle relève de la topologie 
algébrique. Le lecteur remarque peut-être in petto que 
l’auteur de ces lignes n’a pas encore expliqué ce 
qu’étaient ces deux branches de la topologie, de sorte 
que ces remarques sur les propriétés globales ou 
locales semblent un peu gratuites : en fait, comme 
nous essayerons de le montrer plus loin, il est très 
important de savoir de quelle topologie relève un 
problème... ne serait-ce que pour le résoudre ! 

• Un problème de réseau. Voici un problème qui 
ressemble aux énigmes posées aux jeunes lecteurs de 


Un problème de réseau. Si l’on veut donner au 
problème une allure plus concrète, on peut imaginer 
que A, B,F sont des villes et que les segments AB, 
etc., sont des routes joignant ces villes. Le problème 
s’énonce alors ainsi : déterminer l’itinéraire qui per¬ 
met de visiter toutes les villes sans parcourir deux 
fois la même route. 


C 



la presse enfantine : peut-on tracer le réseau suivant — 
qui passe par six nœuds A, B, ..., F — sans lever le 
crayon du papier et sans passer deux fois par le même 
chemin ? 

En tâtonnant quelque peu, on trouvera la solution 
suivante : 



Solution du problème de réseau : il faut partir de A 
pour arriver à A ; on passe deux fois par le point D. 


Dans le cas proposé, le problème est possible et 
simple. Mais si l’on proposait la configuration sui¬ 
vante, il n’aurait aucune solution. 



Il est impossible de tracer cette figure sans repas¬ 
ser deux fois par un même segment. 


Posons-nous maintenant le problème sous sa forme 
la plus générale : le réseau comprend n points A, B, C, 
..., F reliés par des segments en nombre quelconque ; 
existe-t-il un trajet qui permet de parcourir une fois 
seulement tous les segments, et quel est-il ? 

La solution de ce problème exige d’abord une 
définition : nous appelons degré d’un point le nombre 
de segments qui y aboutissent. Par exemple, dans le 
cas simple précédent, le point A est de degré 2 ; le 
point B est de degré 4 ; le point C est de degré 1, etc. 
Cela dit, on démontre les théorèmes suivants, qui 
fournissent la solution du problème : 

— Théorème I : si un point est de degré impair, il 
doit être un point de départ ou un point d’arrivée. 

— Théorème II : si, dans un réseau, il existe plus 
de deux nœuds de degré impair, le problème n’a pas de 
solution. 

— Théorème III : aucun réseau ne possède 
qu’un seul nœud de degré impair ; 

— Théorème IV : s’il n’y a aucun nœud de degré 
impair, le problème est toujours possible quel que soit 
le point de départ, avec lequel est confondu le point 
d’arrivée. 

Dans l’exemple du réseau inscrit dans le triangle 
ACE, il n’y a aucun nœud de degré impair : le problème 
est donc toujours possible et, quel que soit le point de 


départ, on y reviendra. Dans l’exemple du réseau 
inscrit dans un rectangle, il y a 4 nœuds de degré 
impair (les quatre sommets du rectangle), donc d’après 
le théorème II, le problème n’a aucune solution. 

• Le problème des ponts de Kônigsberg est une 
variante du problème précédent ; il a été étudié en 
1735-36 par Euler qui l’expose en ces termes : 

« Il y a, dans la ville de Kônigsberg, une île, appelée 
l’île de Kneiphof, que bordent deux bras de la rivière 
Pregel. Sept ponts traversent ces bras. Il s’agit de 
savoir s’il existe un itinéraire permettant de passer une 
fois, et une fois seulement, sur chacun de ces ponts... » 

En bon mathématicien, Euler ne se limite pas aux 
sept ponts de Kônigsberg ; il généralise ensuite le 
problème au cas d’une rivière de configuration quel¬ 
conque, avec un nombre n de ponts quelconques. 
D’autres problèmes du même type ont intrigué les 
mathématiciens au XVIII e siècle et au début du 
XIX e siècle ; voici quelques exemples. 

— Le problème dit des nœuds (Gauss, Listing, 
etc.) : un réseau électrique est un ensemble de 
conducteurs, et l’on appelle nœud le point de rencon¬ 
tre de deux ou plusieurs conducteurs. Comment répar¬ 
tir ces nœuds en fonction de certaines conditions 
expérimentales données (résistances, intensités, 
etc.) ? 

— Le problème du coloriage d’une carte a été 
abordé — sans succès — par Môbius, De Morgan, 
Cayley, Tait, A. B. Kempe ; ce n’est que tout récemment 
(1976) qu’on a « démontré » — et encore cette 
démonstration n’est-elle pas acceptée unanimement — 
qu’il suffisait de quatre couleurs pour colorier une 
carte de sorte que deux régions quelconques séparées 
par une frontière ne soient pas de la meme couleur. 

— La relation F— A + S = 2 entre le nombre Fdie 
faces d’un polyèdre, le nombre A de ses arêtes et le 
nombre S de ses sommets est connue sous le nom de 
« théorème de Descartes-Euler » ; c’est aussi un pro¬ 
blème d ’ analysis situs. 

— Etc. 


Aperçu historique. 

On se doute bien que la topologie n’a pas unique¬ 
ment été créée pour répondre à des questions dans le 
genre de celles qui précèdent. Mais certaines de ces 
questions ont mis les mathématiciens sur la voie de la 
topologie, dont on va essayer de décrire l’histoire. Pour 
la commodité de l’exposé, nous séparerons la topolo¬ 
gie générale et la topologie algébrique : mais leur 
histoire est enchevêtrée, du moins en ses débuts. 
D’autre part on retiendra cette remarque du mathéma¬ 
ticien belge Guy Hirsch, auteur du chapitre consacré à 
la topologie dans VAbrégé d’histoire des mathémati¬ 
ques publié sous la direction de Jean Dieudonné aux 
éditions Hermann (Paris, 1978). 

... [la topologie générale] contrairement à la topologie 
algébrique, ne semble pas avoir conduit jusqu’à pré¬ 
senté l’élaboration de méthodes nouvelles applicables 
dans d’autres domaines de la mathématique que 
ceux-là mêmes qui lui ont donné naissance (op. cit., 
X. Il, p. 214). 

• La topologie générale. C’est Cantor et Dede- 
kind, les créateurs de la théorie des ensembles présen¬ 
tée p. 15, qui ont posé les premiers jalons de la 
topologie générale. Toutefois les notions topologiques 
qu’ils introduisent à propos de certaines propriétés de 
l’ensemble R des réels (c’est-à-dire l’ensemble des 
points de la droite réelle : voir p. 54) et des espaces à 
n dimensions R n (« espace » est pris ici au sens 
ensembliste défini p. 46) n’ont pas été regroupées en 
une théorie distincte de la théorie des ensembles par 
nos deux auteurs. Autrement dit, ils ont bien vu 
l’aspect topologique des problèmes traités, mais ils 
n’ont pas consacré à ces propriétés une théorie à part 
entière. Parmi les notions topologiques dont ils font 
usage, citons : 

— la notion de point d’accumulation (introduite 
par Weierstrass) ; 

— la notion 6’ensemble des points d’accumula¬ 
tion d’un ensemble ( ensemble dérivé) ; 

— la notion d’ensemble ouvert (ou, plus briève¬ 
ment, d’ouvert), qui, nous le verrons ci-après (p. 129) 
est capitale en topologie. 

Ce n’est qu’au début du XX e siècle que la topologie 
commence à devenir autonome par rapport à la théorie 
des ensembles, lorsque Fréchet (1906) définit des 
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ensembles appelés espaces abstraits qui ne sont pas 
des sous-ensembles euclidiens (comme la droite réelle 
par exemple) et qui possèdent néanmoins des proprié¬ 
tés topologiques (en particulier dans lesquels on peut 
définir des ouverts respectant certains axiomes dits de 
structure topologique). C’est Hausdorff (1914) qui posa 
le système axiomatique qui est à la base de la topologie 
générale, et l’on doit au mathématicien polonais 
Banach l’essentiel de la théorie des espaces normés 
(voir p. 106) qui est un outil extrêmement puissant. 

• La topologie algébrique (ou combinatoire). 

— Les origines de la topologie combinatoire 
remontent aux travaux d’Euler. Le problème des ponts 
de Kônigsberg (1735) débouche sur la théorie des 
graphes (un graphe est un ensemble formé d'arêtes et 
de nœuds ; page 128, nous avons étudié des pro¬ 
blèmes de réseaux : un réseau géométrique euclidien 
est un graphe particulier. On peut concevoir des 
graphes dont les arêtes seraient non pas des seg¬ 
ments de droite, mais des images homéomorphes de 
ces segments). C’est aussi à Euler qu’on doit l’énoncé 
de la formule d’Euler (1750-1751); en appelant S le 
nombre de sommets d’un polyèdre, A le nombre de 
ses arêtes et F le nombre de ses faces, on a la relation 
suivante : 

S-A + F= 2. (1) 

Cette formule avait été établie par Descartes, mais 
dans une perspective toute différente. Ainsi un cube 
est un polyèdre à 8 sommets, 12 arêtes et 6 faces, et 
l’on a bien : 

8-12 + 6 = 2 . ( 2 ) 

La première démonstration de la formule d’Euler est 
due à un élève de Gauss, Karl von Staudt (1847). La 
propriété (1) est topologique, car elle s’applique aussi 
bien à un polyèdre euclidien classique qu’à un polyè¬ 
dre dont les faces seraient courbes par exemple au lieu 
d’être planes. Elle a été étudiée dans cet esprit par de 
nombreux mathématiciens, au XIX e siècle (en particu¬ 
lier par Le Gendre, Cauchy, Gergonne, Môbius, Listing, 
Jordan, etc.). 

— Entre 1850 et 1890 environ, deux catégories 
de travaux doivent retenir notre attention. 

1 - Il y a d’abord les recherches de Riemann sur 
la théorie des fonctions d’une variable complexe (voir 
p. 124) qui le conduisent à une interprétation géométri¬ 
que (surfaces de Riemann). Pour généraliser les 
théories de Riemann (qui disparut prématurément à 
l’âge de 40 ans), des mathématiciens comme Betti, 
Félix Klein, et — plus tard — W. von Dyck ont utilisé et 
étendu les raisonnements dont on s’était servi pour 
démontrer la formule d’Euler. 

2 - A ce corps de doctrines, assez homogènes, il 
faut ajouter la découverte de surfaces non orientables, 
comme le ruban de Môbius (1858) ou la bouteille de 
Klein (1882). Le traitement analytique de ces surfaces 
relève aussi de méthodes proches de celles auxquelles 
nous venons de faire allusion et qu’on nomme, depuis 
Listing (1836) des méthodes topologiques. C’est aussi 
à cette époque que le mathématicien anglais Francis 
Guthrie posa à son maître et collègue De Morgan le 
fameux problème des quatre couleurs (1852) : sur la 
sphère (ou dans le plan) il suffit de quatre couleurs 
pour colorier une carte sans que jamais deux régions 
séparées par une frontière aient la même couleur. 
Cette conjecture (proposition plausible, mais non 
démontrée) a intrigué et intrigue encore les mathémati¬ 
ciens (une « démonstration » — qui n’en est peut-être 
pas une — a été proposée en 1976 par Appel et Haken ; 
la méthode employée par ces deux auteurs repose sur 
l’emploi d’un ordinateur). 

Tous ces travaux relèvent de ce qu’on a appelé la 
topologie combinatoire. 

— Entre 1892 et 1905 environ, Poincaré est 
conduit à aborder des problèmes de nature topologi¬ 
que en étudiant des courbes définies par des équations 
différentielles et des fonctions de variables complexes. 
En particulier, il est amené à définir des êtres mathé¬ 
matiques appelés complexes, divisés en cellules, et 
qui jouent un rôle important en topologie combinatoire 
et la théorie des complexes débouche, sur une autre 
théorie, appelée homologie et J’étude de ce qu’on 
nomme des variétés (classe de figures qui intervien¬ 
nent dans l’étude de fonctions à plusieurs variables). 
L’exploitation des travaux de Poincaré a contribué à la 
création de la topologie algébrique, comme on nomme 
à partir de 1928 la généralisation des théorèmes de la 
topologie combinatoire. 

— Durant le premier tiers du XX e siècle, les 
concepts proposés par Poincaré et quelques autres 
subirent un traitement axiomatique féroce, et la décou¬ 


verte du rôle des structures algébriques en topologie 
permet la création et l’exploitation de nouveaux 
concepts : notion de catégorie (à partir d’une proposi¬ 
tion connue sous le nom de « théorème de Poincaré », 
des travaux de Hopf vers 1928), exploitée par Eilenberg 
et MacLane en 1942 ; concepts d 'invariance (Alexan¬ 
der, Lefschetz), de point fixe (Brouwer, vers 1910) ; 
étude des champs de vecteurs (Brouwer, 1909, Whit- 
ney, 1935) ; notion de cohomologie (Lefschetz, 1930 ; 
Aleksandrov, 1932 ; Leray et H. Cartan, 1945). 

— A partir de 1930/1935, les théories topologi¬ 
ques deviennent de plus en plus abstraites. La notion 
d’ homotopie est analysée par Ôech (à partir de 1932) et 
par Hurewicz (1935-1936) ; des espaces topologiques 
nouveaux font l’objet de travaux nombreux et très 
riches par leurs conséquences : espaces fibrés, 
H-espaces (« H » est l’initiale de Hopf), espaces 
d’Eilenberg-MacLane (1942), etc. 

— Isolons enfin une conjecture établie par Poin¬ 
caré et étudiée par Tietze en 1908 ; on la nomme 
Hauptvermutung, ce qui signifie en allemand 
« conjecture fondamentale » et nous ne l’expliquerons 
pas ici. Le grand problème est de savoir si cette 
conjecture est vraie ou fausse, et pour quels espaces 
elle est vraie. La question a été étudiée par J. Milnor 
(1961), Kirby et Siebenmann (1969), E. Moïse (1952), 
pour ne citer que les principaux travaux. 


Deux théories fondamentales. 

Topologie générale de la droite réelle. 

• Remarques préliminaires. 

1 - Considérons un ensemble X que nous 
nommerons un espace (au sens défini p. 46), et dont 
les éléments seront appelés des points. Dans le cas 
très particulier où ces éléments sont des points au sens 
géométrique du terme, l’espace est lui-même géomé¬ 
trique. Ainsi une ligne (droite ou courbe) est un espace 
à caractère géométrique ; une surface (plane ou gau¬ 
che) est un espace géométrique ; un ensemble de 
courbes est un espace géométrique, etc. Mais ce 
caractère géométrique, très commode pour les expli¬ 
cations imagées, est très particulier. On peut considé¬ 
rer un espace dont les éléments sont des nombres, ou 
encore des fonctions ou les valeurs de ces fonctions. 
Un ensemble particulièrement intéressant pour nous 
est l’ensemble IR des nombres réels (voir p. 53). 
L’image de cet ensemble est la ligne droite, prolongée 
à l’infini dans les deux sens : à chaque point (et il en a 
une infinité) de la droite correspond un nombre réel. 
L’ensemble U peut donc être appelé la droite réelle. 

2 - Page 7, nous avons étudié les ensembles de 
deux points de vue. 

— d’une part nous avons examiné les notions 
d 'appartenance à un exemple, d’ensembles nombra- 
bles ou dénombrables, de relation d'ordre, d'applica¬ 
tion, etc. ; ce point de vue est rigoureusement ensem- 
bliste ; 

— d’autre part, nous avons appris à calculer 
dans un ensemble, c’est-à-dire à poser des règles 
opératoires sur les éléments d’un ensemble (les lois 
de composition interne ou externe, étudiées p. 36) ; 
ces règles décrivent ce qu’on appelle la structure 
algébrique de l’ensemble considéré ou, plus briève¬ 
ment, son algèbre. 

Nous allons maintenant munir un ensemble d’une 
structure dite topologique (et non plus algébrique). 
L’intérêt de cette structure, qui permet d’appeler 
l’ensemble qui en est muni : un espace topologique, 
sera compris par la suite. L’ensemble sur lequel nous 
allons travailler sera la droite réelle IR. Les propriétés 
que nous décrirons dans IR pourront être, interprétés 
de deux manières : 1° analytiquement, comme des 
propriétés concernant les nombres réels ; 
2° géométriquement comme des propriétés concer¬ 
nant les points d’une droite. 

• Notion d’ouvert. Page 17, nous avons défini 
les relations d’ordre symbolisées par « < » et « ss » 
(ou « > » et « ^ »), et les notions d'intervalle ouvert 
]a, b[ et d’intervalle fermé [a, b]. Dans le cas de 
l’ensemble IR, l’intervalle ]a, b[ contient tous les réels 
compris en a, et b, à l’exclusion de a et b, tandis que 
l’intervalle [a, b] est composé de tous les réels 
compris entre a et b, de a et de b. 

Considérons maintenant un sous-ensemble A de IR. 
Nous dirons que A est un ouvert : 1° s’il est vide 
(A = 0) ; 2° si, pour tout x G A, il existe un intervalle 
ouvert contenant x et contenu dans A. 


TOPOLOGIE DE LA DROITE RÉELLE 

En d’autres termes, sur la droite réelle, un ouvert est 
une réunion d’intervalles ouverts (bien entendu, un 
intervalle ouvert de IR est un ouvert). 



a b c d 


La droite que nous avons tracée sur cette figure, 
indéfiniment prolongée dans les deux sens, est 
l’image géométrique de l’ensemble R des réels (cha¬ 
que point de cette droite correspond à un nombre 
réel). Le segment ab sans les points a et b est un 
intervalle ouvert ]a, b[ ; de même ]c, d[ est un inter¬ 
valle ouvert composé de tous les points du segment, 
c’est-à-dire à l’exclusion des points c et d. D’après la 
définition donnée dans le texte, le sous-ensemble 
A = ]a, b[ de IR est un ouvert ; il en est de même du 
sous-ensemble B = ]c,d[ et de la réunion C = A U B 
des deux sous-ensembles. On notera que C, qui est 
un ouvert, n’est pas un intervalle ouvert: Il ne 
contient pas le segment bc. 


La définition que nous venons de donner d’un ouvert 
de IR est équivalente aux quatre axiomes suivants : 

— 0 1 : l’ensemble vide 0 est un ouvert ; 

— O 2 : la droite réelle (R est un ouvert ; 

— 0 3 : toute réunion, finie ou non d’ouverts est un 
ouvert ; 

— 0 4 : toute intersection finie d’ouverts est un ouvert. 

• Notion de fermé. Un sous-ensemble A de IR 
est dit fermé si son complémentaire dans IR, C A, est 
fermé. Cette propriété correspond aux quatre 
axiomes : 

— F 1 : l’ensemble vidé 0 est un fermé ; 

— F 2 : la droite réelle F est un fermé ; 

— F 3 : toute intersection, finie ou non , de fermés est 
un fermé ; 

— F 4 : toute réunion, finie, de fermés est un fermé. 
(On remarque que la propriété F 1 est duale de la 
propriété 0 2 ; que F 2 est duale de etc.) 

• Structure topologique de la droite IR. Considé¬ 
rons l’ensemble IR des réels ; nous avons vu qu’on 
pouvait le munir d’une structure algébrique définissant 
les opérations fondamentales sur les réels et leurs 
propriétés, c’est-à-dire permettant de calculer sur les 
nombres réels. C’est à ce calcul que sont entraînés 
tous les collégiens du monde. 

Nous venons en outre de constater qu’on pouvait 
aussi définir dans IR des sous-ensembles (= des parties 
de IR) respectant les axiomes O l5 0 2 , 0 3 et 0 4 . Appelons 
ü l’ensemble des parties de IR qui sont des ouverts. Le 
fait que IR soit une collection d’ouverts entraîne, pour 
les nombres réels, un certain nombre de propriétés qui 
n’étaient pas impliquées par la structure algébrique de 
la droite. En d’autres termes, le fait d’avoir défini, outre 
l’ensemble IR, l’ensemble Ü des ouverts de IR confère à 
IR des propriétés nouvelles, qu’on appelle des proprié¬ 
tés topologiques. On dit encore qu’on a muni la droite 
U d’une structure topologique (d’une topologie), ou 
encore que le couple (R, Ü) est un espace topologique, 
ou encore que Ü définit sur IR une topologie. 

• Notion de voisinage. Supposons qu’un fabri¬ 
cant de confitures fasse figurer sur l’étiquette d’un pot 
de confiture la mention : « poids voisin de 250 g ». 
Qu’est-ce que cela signifie concrètement ? Qu’il y a, 
dans le pot, 250 grammes de confiture plus ou moins 
quelques grammes. Dans le langage du mathémati¬ 
cien, on doit dire : « le nombre qui exprime le poids en 
grammes de confiture contenu dans ce pot est voisin 
du réel x= 250 ». Mais le mathématicien a plus d’exi¬ 
gences que le fabricant de confitures : il lui faut aussi 
définir ce qu’il entend par voisinage de x. 

Cette définition n’est possible que si l’on a muni la 
droite IR d’une topologie, c’est-à-dire si l’on a posé les 
axiomes 0 1f 0 2 , 0 3 et 0 4 . Alors nous définissons ainsi le 
voisinage V d’un point x G IR : on appelle voisinage 
d’un point x G IR tout sous-ensemble V de U contenant 
un ouvert contenant x. Cette définition mérite quel¬ 
ques commentaires. 

1 - Le voisinage est une propriété topologique, 
puisqu’il ne peut être défini qu’à l’aide de l’ensemble Ü 
des ouverts de IR. 

2 - Nous avons vu que tout intervalle ouvert de 
nombres réels est un ouvert, donc V est un voisinage 
de x si V contient un intervalle ouvert contenant x. Par 
exemple le sous-ensemble (ouvert) ]200, 300[ est un 
voisinage de 250, puisqu’il contient, entre autres exem¬ 
ples, l’ouvert ]240,260[ qui contient x = 250. Et 
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LA THÉORIE SIMPLICIALE 

l’ouvert ]240, 260[ est lui aussi un voisinage de x, 
puisqu’il contient l’ouvert ]245, 255[ qui contient x, 
etc. Bien plus : la droite IR, qui n’est autre que l’inter¬ 
valle + °°[, est aussi un voisinage de x. 

3 - On voit donc que le réel x a une infinité de 
voisinages. Pour que la mention « x est voisin de 
250 g » ait une signification, il faut préciser de quel 
voisinage il s’agit (c’est-à-dire quel est l’écart maximal 
admis par rapport à 250 g). 

4 - Soit A un sous-ensemble de IR et soit x 0 un 
nombre réel. Le nombre x 0 est dit point d’accumula¬ 
tion de A si, dans tout voisinage de x 0 , il existe au 
moins un point de A autre que x 0 . 

Considérons par exemple le sous-ensemble ]0, 1 [. 
Tout voisinage de C est un ouvert contenant Ü ; il 
contient donc : 1° 0 ; 2° des réels plus petits que 0 
(= négatifs) ; 3° des réels plus grands que 0 

(= positifs). Or, parmi les réels positifs, il en est qui 
sont inférieurs à 1, donc compris dans l’intervalle 
JO, 1 [ : il existe donc, dans tout voisinage de 0, au 
moins un nombre appartenant au sous-ensemble ]0, 1 [ 
et qui soit différent de 0 : 0 est donc un point d’accu¬ 
mulation pour A = ]0,1 [. On pourrait montrer de même 
que 1 est un point d’accumulation pour A 

• Conséquences. La droite IR étant munie d’une 
topologie (c’est-à-dire de la définition des ouverts — 
ou des fermés — dans DR), on peut démontrer un grand 
nombre de propositions qui décrivent les propriétés en 
rapport avec cette structure. Nous avons rencontré 
certaines de ces propositions pp. 17-18. Par exemple : 

1 - toute partie non vide majorée de IR a une 
borne supérieure ; 

2 - toute partie non vide minorée de IR a une 
borne inférieure. 

Ces deux propriétés sont fondamentales. Elles per¬ 
mettent en particulier d’étudier les suites numériques 
(voir p. 106). Ainsi, en vertu de la proposition 1, toute 
suite croissante majorée possède une limite et, en 
vertu de la proposition 2, toute suite décroissante 
minorée a une limite. De telles suites sont donc 
convergentes. 

Il existe d’autres propriétés de la droite réelle IR qui 
peuvent être déduites de sa structure topologique et 
qui conduisent à d’importants théorèmes de la théorie 
des fonctions d’une variable réelle (par exemple le 
théorème de Bolzano-Weierstrass). 

• Généralisations. 

— Les points du plan sont les images de 
l’ensemble R 2 , qui, on l’a vu à la page 53, peut être 
muni de la structure d’espace vectoriel (ses éléments 
ont pour images les vecteurs de la géométrie plane 
classique). Considérons, dans le plan R 2 , un rectangle 
de dimensions a x b ; on l’appelle un pavé. Tous les 
points appartenant à la surface du rectangle, en y 
comptant ceux qui appartiennent à son périmètre, 
forment un pavé fermé ; si on exclut le périmètre, on a 
un pavé ouvert. Il est facile de démontrer que toute 
réunion de pavés ouverts est un ouvert, c’est-à-dire 
respecte les axiomes suivants : 

— 0 1 : l’ensemble vide 0 est un ouvert ; 

— 0 2 : le plan R 2 est un ouvert ; 

— 0 3 : toute réunion, finie ou non, d’ouverts est un 
ouvert ; 

— 0 4 : toute intersection finie d’ouverts est un ouvert. 

On peut donc munir l’espace R 2 d’une topologie, et 

en déduire les propriétés topologiques du plan, qui 
sont les images des propriétés topologiques d’une 
fonction de deux variables réelles f(x, y). 

— L’espace R 3 (l’espace euclidien classique) est 
une collection de pavés à trois dimensions a x b x c ; 
ici aussi on distingue des pavés ouverts, constitués de 
tous les points du parallélépipède a x b x c à l’excep¬ 
tion des points situés sur les faces de ce parallélépi¬ 
pède, et des pavés fermés. Une réunion de pavés 
ouverts est appelée un ouvert. Les ouverts de R 3 
vérifient les axiomes 0 1; 0 2 , 0 3 et 0 4 ; l’espace R 3 est 
ainsi muni d’une topologie. Les propriétés topologi¬ 
ques de l’espace à 3 dimensions sont les images des 
propriétés topologiques des fonctions de trois varia¬ 
bles réelles f(x, y, z). 

L’une de ces propriétés topologiques est la sui¬ 
vante : considérons une surface A dans l’espace R 3 (ce 
peut être aussi bien une surface géométrique, comme 
la surface latérale d’un cône, la surface d’un cube, la 
surface d’une sphère, etc., qu’une surface gauche 
quelconque). Imaginons que ces surfaces soient en 
caoutchouc : on peut les déformer d’une manière 
continue (c’est-à-dire simplement en les étirant ou en 
les comprimant, sans déchirure, ni pliage, ni collage). 
Une telle déformation est appelée une homéomorphie, 
et — comme on l’a dit p. 127 — elle conserve 
certaines propriétés, qu’on appelle topologiques. 


• Conclusion (provisoire). Nous avons muni la 
droite, le plan et l’espace de la géométrie d’Euclide 
d’une structure topologique, en y définissant des 
ouverts et en constatant qu’ils respectaient les quatre 
axiomes 0 1f 0 2 , 0 3 et 0 4 . Aux propriétés affines, 
métriques et projectives des figures il faut donc ajouter 
leurs propriétés topologiques (par exemple, la formule 
d’Euler est une propriété topologique des polyèdres). 
Ces propriétés sont les images de propriétés des 
fonctions d’une, deux ou trois variables réelles. Munir 
un ensemble d’une topologie n’est donc pas unique¬ 
ment un jeu abstrait pour mathématiciens avertis ; 
c’est une manière de découvrir de nouvelles propriétés 
des figures et des fonctions. 

Page 131, nous généraliserons encore cette mé¬ 
thode, en l’appliquant à n’importe quel ensemble E. 
Dès lors la topologie de la droite réelle ou de l’espace 
euclidien sera considérée comme un cas particulier de 
la topologie d’un ensemble quelconque, aussi abstrait 
soit-il. Il en résulte une importante économie de 
démonstration : telle propriété démontrée d’une 
manière très générale pour un espace topologique 
quelconque (c’est-à-dire pour un ensemble quelcon¬ 
que muni d’une topologie) contient en puissance 
toutes les propriétés topologiques particulières à la 
droite, au plan, etc. 

La théorie simpliciale et l'homologie. 

Cette théorie est un des chapitres les plus fondamen¬ 
taux de l’algèbre combinatoire ; elle a été établie par 
Poincaré (1892-1905), puis approfondie par de nom¬ 
breux mathématiciens, dont Hopf (1928), et elle débou¬ 
che sur la théorie de l’homologie que développèrent 
notamment Veblen et Alexander (principalement à 
partir de 1913). Une généralisation plus récente a 
conduit à la théorie du cobordisme (R. Thom, 1954). 

• La notion de simplexe. On appelle simplexe à 
n dimensions dans un espace R n un sous-ensemble 
borné de cet espace déterminé par n + 1 points de cet 
espace et qu’on appelle sommets du simplexe. 

Pour n ss 3, il est possible de donner des images 
géométriques des simplexes (mais il ne faut pas oublier 
que ce sont des images, et qu’il leur correspond des 
fonctions, c’est-à-dire des éléments analytiques). Pour 
n > 3, la représentation géométrique n’est plus possi¬ 
ble, et lorsqu’on parle de points, par exemple, il faut 
entendre des éléments représentés par des fonctions 
de réels. Limitons-nous donc ici à des exemples pris 
sur la droite R, dans le plan euclidien R 2 et dans 
l’espace euclidien R 3 , qui sont étudiés en géométrie 
élémentaire. 

— Sur la droite (n = 1), un simplexe est défini 
par 2 points a 0 et a 1 : c’est le segment a 0 a v Dans le 
plan (n = 2), un simplexe est défini par 
n + 1=3 sommets a 0 , a 1f a 2 : c’est un triangle. Dans 
l’espace (n = 3), un simplexe défini par n + 1=4 
points non dans un même plan : c’est un tétraèdre 
(pyramide dont les quatre faces sont des triangles). 
Notons au passage qu’un point est un simplexe de 
dimension nulle (si n = 0, le simplexe est défini par 
n + 1=1 point). 

— Nous désignerons un simplexe par le sym¬ 
bole cr, et nous indiquerons en exposant sa dimension. 
Ainsi un simplexe à 1 dimension (segment) se dési¬ 
gnera par ct 1 ; un simplexe à 2 dimensions (triangle), 

Représentation d’un simplexe à 3 dimensions. 
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par a 2 ; un simplexe à 3 dimensions par cr 3 , etc. Nous 
appellerons faces d’un simplexe à n dimensions les 
simplexes an — 1 dimensions obtenus en supprimant à 
tour de rôle un des sommets du simplexe considéré. 
Ainsi le simplexe à 3 dimensions cr 3 = (a 0 , a v a 2 , a 3 ) 
possède n + 1=4 faces à n — 1=2 dimensions, que 
nous distinguerons par des indices : CT 2 , CT 2 , CT 2 , cri 
(l’exposant rappelle que ces faces sont des simplexes à 
2 dimensions) : 

= (Si, a2, 33) ; 

rr 1 = (âo, a 2, a 3) \ 

cri = (a 0 , a u a 3 ) ; ^ 

3 = (âo, 3 1, 32) . 

De même un triangle (n = 2) possède 3 faces à 
n — 1=1 dimension, à savoir ses trois côtés. 

— Lorsqu’un simplexe est défini par ses n som¬ 
mets dans un ordre déterminé, il est dit ordonné. Il y a 
donc autant de simplexes ordonnés que de permuta¬ 
tions possibles pour n objets, soit n ! (lire « factorielle 
n » ; n! = 1 x 2 x 3 x ... x n; voir p. 33). Ainsi les 
trois points a 0 , a ^ et a 2 définissent 6 triangles 
ordonnés : 

(a 0 , ^i, a 2 ) (a 0 , a 2 , â-j) 

(a 1? a 2 , a 0 ) (a 2 , a 1f a 0 ) 

(a 2 , a 0 , a A ) (a 1t a 0 , a 2 ). 

Les simplexes de la première colonne se déduisent 
les uns des autres par une permutation paire (voir 
p. 35), et sont dits pour cette raison équivalents. Il en 
est de même pour les simplexes de la deuxième 
colonne (en revanche on ne peut pas passer d’un 
simplexe de la première colonne à l’un de la seconde 
par une permutation paire). En résumé, les simplexes 
ordonnés à 2 dimensions (triangles) correspondant 
aux trois points a 0 , a 1} a 2 se réduisent à 2 triangles 
dont on parcourt les sommets en sens inverse (a 0 , a^, 
a 2 ) et (a 0 , a 2 , a-i). On dit qu’il s’agit de simplexes 
orientés, et on les note o + et o~. De même deux 
points sur une droite, a 0 et a 1, définissent les deux 
simplexes orientés (segments) a + = (a 0 , ai) et o~ = 
(a- 1, a 0 ). 

• Notion de complexe. On appelle complexe ou 
encore polyèdre un ensemble fini de simplexes soudés 
entre eux par leurs faces. 

— Dans le plan R 2 , par exemple, un complexe à 
2 dimensions est une figure obtenue par l’assemblage 
d’un nombre fini de triangles (en géométrie élémen¬ 
taire, la figure est appelée « polygone » ; nous la 
nommerons « polyèdre à 2 dimensions »). Dans 
l’espace R 3 , un polyèdre à 3 dimensions est la figure 
composée de tétraèdres soudés par leurs faces (ici, le 
terme « polyèdre » est pris en son sens usuel). 
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Les quatre triangles (simplexes teintés en gris et 
en bleu), ainsi assemblés, forment un polyèdre à 2 
dimensions l Nous avons utiiisé la notation 07 , n 
désignant la dimension des éléments (ainsi les som¬ 
mets sont des points de dimension nulle, notés cr 0 ; 
les côtés des triangles sont notés o- 1 ; les triangles 
eux-mêmes a 2 ). 


— On appelle chaîne à n dimensions d’un 
polyèdre toute combinaison linéaire des simplexes du 
polyèdre considéré. Par exemple la combinaison : 

CTi + cri + CT% 4- (T 4 (2) 

des simplexes (triangles) constituant le polyèdre de la 
figure précédente est une chaîne à 2 dimensions 
(puisque, pour un triangle, n = 2). Si l’on distingue 
entre deux simplexes orientés ct~ et cr + , on identifie le 
simplexe cr~ au simplexe <r + précédé du coefficient — 1. 
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• Notion de bord. Oublions les représentations 
•géométriques concrètes, et considérons (n+ 1 ) points 
a 0 , a 1t a 2 , a n définissant un simplexe a à n dimen¬ 
sions. D’après ce qui a été expliqué plus haut, on 
obtient les faces de ce simplexe en écrivant tous les 
sommets moins un de a. Ainsi, en supprimant le 
sommet a 0 on obtient la face (a^ a 2 , a n ) qui est 
elle-même un simplexe à (n- 1 ) dimensions (une 
dimension de moins que a). Les autres faces de a 
sont : 

(a 0 , a 1 , ..., a n ) (en enlevant a^ ; 

(a 0 , a v a 3 , ..., a n ) (en enlevant a 2 ) ; 

etc. 

(a 0 , a v a 2 , ..., â,... a n ) (en enlevant a,) ; 

etc. 

(a 0 , a v ..., a n _i) (en enlevant a n ). 

Le symbole â, désigne le sommet supprimé. 

— On appelle bord da du simplexe à n dimen¬ 
sions a la chaîne à (n — 1 ) dimensions de ses faces 
munies du coefficient 1 ou -1 : 

9<t = (a„ a 2 .a„) + (- 1 )'(a 0 , a,. à, .a„) + ... 

+ (- 1 )"(a 0 ,a,.a„_,). ( 3 ) 

L’introduction du coefficient ± 1 est liée à la conven¬ 
tion cr~ = ( 1 ) cr + . Si on ne distingue pas entre a~ et cr + , 

on évite les coefficients - 1 , ce qui rend le calcul plus 
simple, comme on va le voir sur l’exemple ci-dessous. 

— Reprenons le polyèdre à 2 dimensions de la 
figure déjà proposée plus haut. Il est composé de 
simplexes à deux dimensions af (/ = 1,2, 3, 4), à savoir 
de triangles. Les faces de chaque simplexe sont des 
simplexes à 1 dimension cr) (y = 1 , 2 , ..., 8 ). Considé¬ 
rons la chaîne à 2 dimensions 

cr i 4- cr 2 

qui a pour image les deux triangles bleus accolés (l’un 
clair et l’autre foncé). Les sommets de af sont (or?, cr°, 
erg) et ceux de a\ sont (o-°, o-g, crj) ; les faces de ces deux 
simplexes sont les côtés a], a\, cri, l et al des 
triangles. Le bord de la chaîne a? + crf est la chaîne à 1 
dimension des faces en question. Si l’on oriente les 
triangles, on utilise la règle (3) ci-dessus. On peut aussi 
renoncer à cette orientation et additionner les faces 
modulo 2 (ce qui revient à supprimer toute face qui 
figure 2 fois) ; on a alors : 

3(cri 4- a 2 ) = (cri + a\ + al) + {al 4- a\ 4- 0 - 5 ) . (4) 

L’addition modulo 2 donne : 

d(af 4- a%) = a] + al + a\ + al , (5) 

ce qui est la définition classique du bord d’un polygone 
en géométrie élémentaire. 

• Notion de cycle. Si le bord d’une chaîne à n 
dimensions est 0 , la chaîne est appelée un cycle à n 
dimensions. Considérons, par exemple, le bord de la 
chaîne cr? - 1 - a\ donné par l’équation ( 5 ) : ce bord n’est 
autre que le périmètre du polygone à 4 sommets a° v <x°, 
o-g, 0 - 5 . Calculons le bord du bord de la chaîne, soit 
8 ( 0 -] 4- al + a\ 4- o-J). Pour cela, il faut faire l’addition 
modulo des faces de chaque simplexe cr 1 ; or les faces 
d’un segment (1 dimension) sont les points (0 dimen¬ 
sion) limitant ce segment ; on a donc : 

9(cti 4- 0-3 4- al + al) = (cr? 4- a%) + (cr? + cr?) 4- (cr? 4- a 4 ) 

+ {a 0 2 +a° 4 ) + {a 0 3 +a° 4 ). ( 6 ) 

On constate que chaque sommet est répété deux 
fois, donc 

9(cri + cr^ + cri-I-CTs) = 0 . (7) 

Le bord de la chaîne cr? 4- crf est donc un cycle à 1 
dimension. 

Plus généralement, un cycle à n dimensions est une 
chaîne à n dimensions dont la valeur est 0. Lorsqu’un 
cycle Z est un bord pour un complexe K, on dit que « Z 
est homologue à zéro sur K», et on écrit cette relation 
sous la forme : 

Z ~ 0 sur K , ( 8 ) 

relation qui a été appelée par Poincaré relation 
d’homologie, ou, plus brièvement, une homologie. 

• Nombre de Betti. Soit un polyèdre K à n 
dimensions ; on peut y définir le groupe des bords et le 
groupe des cycles. Le quotient du groupe des cycles 
par le groupe des bords est un groupe appelé groupe 
d’homologie. C’est un groupe commutatif, somme d’un 
certain nombre de groupes monogènes libres : ce 


nombre a été appelé par Poincaré n-ième nombre de 
Betti du polyèdre K (en hommage au mathématicien 
italien Betti). 


PRINCIPAUX ASPECTS 
DE LA TOPOLOGIE. 


La topologie est une branche très générale des 
mathématiques, qui sert non seulement à résoudre 
certains problèmes inabordables ou difficilement abor¬ 
dables par les méthodes usuelles de la géométrie et de 
l’analyse (par exemple le problème du coloriage d’une 
carte, les problèmes de réseaux, etc.), mais qui généra¬ 
lise d’une manière très abstraite et très fructueuse des 
théories mathématiques très diverses. Il est impossible, 
dans le cadre de cet ouvrage, de résumer tous les 
aspects de la topologie ; nous en soulignerons simple¬ 
ment les plus importants. 

La topologie générale. 

Espaces topologiques. 

• Définition. On appelle espace topologique 
tout couple (E, Ü), E étant un ensemble et 0 un 
ensemble de parties de E appelées des ouverts, satis¬ 
faisant aux quatre axiomes : 

— O a : l’ensemble vide 0 est un ouvert ; 

— 0 2 : l’ensemble E est un ouvert ; 

— 0 3 : toute réunion, finie ou non, d’ouverts est un 
ouvert ; 

— 0 4 : toute intersection finie d’ouverts est un ouvert. 

On dit encore qu’on a défini une topologie sur E, ou 

qu’on a muni E d’une topologie. 

Page 129, nous avons vu que l’ensemble U (la 
droite réelle) et l’ensemble Ü des intervalles ouverts 
de U définissent une topologie. De même on peut 
munir d’une structure topologique le plan euclidien M 2 
en considérant les pavés ouverts de ce plan. Bien 
entendu, tout ensemble E peut être muni d’une topolo¬ 
gie, quelle que soit sa nature, à partir du moment où 
l’on y définit l’ensemble 0 des ouverts, qui caractérise 
la structure topologique de l’espace en cause. 

En général, on peut définir plusieurs topologies sur 
un ensemble : tout dépend de la définition de l’ensem¬ 
ble 0 choisie. 

1 - Si l’on pose: 0 = ensemble de toutes les 
parties de E, c’est-à-dire si l’on décide d’appeler 
« ouvert » toute partie de E, la topologie ainsi définie 
est dite discrète. C’est celle qui comporte le plus grand 
nombre possible d’ouverts. 

2 - Si l’on pose : 0 = { 0 , E}, c’est-à-dire si l’on 
décide de n’appeler « ouvert » que l’ensemble vide et 
l’ensemble tout entier, la topologie est dite grossière ; 
c’est celle qui comporte le moins d’ouverts possible. 

3 - Les topologies les plus fructueuses sont 
celles qui ne sont ni discrètes, ni grossières. 

• Concepts topologiques. Dans un espace topo¬ 
logique (E, 0) on peut définir un certain nombre de 
concepts qui traduisent les propriétés topologiques de 
cet espace, notamment : 

— le voisinage V d’un point xE E; 

— l’ensemble V{x) des voisinages V de x ; 

— ce qu’est un point d’accumulation, un point 
isolé, un point adhérent ; 

— la fermeture et l'intérieur d’un ensemble ; 

— la frontière d’un ensemble ; 

— ce qu’est un ensemble dense, non dense ou 
partout dense ; 

— la connexité. 

Si l’ensemble E est la droite réelle IR ou le plan 
euclidien U 2 , ces concepts, dont la définition est 
rigoureuse à partir du moment où l’on a muni IR ou IR 2 
d’une topologie, peuvent être traduits par des images 
géométriques. 

• Fonctions continues. La continuité d’une 
fonction y = f{x), x et y étant des éléments de deux 
ensembles X et Y, ne peut être définie que si X et Y 
sont munis d’une topologie (nécessaire pour parler de 
voisinages). 

— L’application X— f —+ Y est continue en x 0 GX 
si à tout voisinage V de f(x 0 ) il correspond un voisinage 
v de x 0 dont l’image par f soit V. Si elle est continue 
pour tout x E X, elle est dite continue sur x. 

— Si deux espaces topologiques X et Y peuvent 
être mis en correspondance par une bijection (voir 
p. 21 ) continue, ils sont dits homéomorpnes, ou 
encore isomorphes topologiquement. Nous avons ren¬ 
contré des exemples d’homéomorphie p. 130. 


ESPACES TOPOLOGIQUES 

• Concept de connexité. L’idée intuitive de 
connexité est banale : elle correspond au fait qu’un 
ensemble est en un seul « morceau » et non en plu¬ 
sieurs. Par exemple une feuille de papier est une 
surface en un seul morceau : nous disons qu’elle est 
connexe ; mais la surface formée par un ensemble de 
2 feuilles séparées n’est pas connexe. De même, consi¬ 
dérons les deux fonctions d’une variable réelle x : 

y = 3 x ; y — — . 

x 

Nous avons vu, en analyse, que l’image de la pre¬ 
mière est une ligne droite passant par l’origine des 
axes de coordonnées, et que l’image de la seconde est 
une hyperbole équilatère, dont l’une des branches est 
dans l’angle xOy et l’autre dans l’angle x’Oy'. L’ensem¬ 
ble des points représentatifs de la fonction y = 3 x est 
connexe (en un seul «morceau », à savoir la droite 
y — 3 x) ; l’ensemble dès points représentatifs de la 
fonction y = 1 /x est en deux « morceaux », (les deux 
branches de l’hyperbole) : il n’est pas connexe. 

— Pour définir la connexité d’un ensemble E, 
commençons par le munir d’une topologie, c’est-à-dire 
par y définir des ouverts (et, respectivement, des 
fermés) respectant les quatre axiomes 0 1t 0 2 , 0 3 et 0 4 
déjà énoncés. On peut alors définir ainsi un espace 
connexe : * 

un espace topôlogique E est connexe s’il n’existe 
aucune partition de E en deux ouverts non vides (ou, 
ce qui revient au même, en deux fermés non vides). 
Cette définition est équivalente à la suivante : un 
espace topologique E est connexe si les seules parties 
de E à la fois ouvertes et fermées sont E et 0. 

— Prenons quelques exemples. 

1 - L’ensemble IR des réels est connexe. 

2 - Tout intervalle (ouvert ou fermé) de IR est 
connexe. 

3 - Toute partie de IR qui n’est pas un intervalle 
n’est pas connexe. En effet, si A n’est pas un intervalle 
de (R, il existe alors deux points x, yEA, tels que 
[x, y] <£A ; donc il existe un point a appartenant à 
l’intervalle [x, y] et n’appartenant pas à A. On peut 
donc partager l’ensemble A en deux ensembles non 
vides A D ]<—, a[ et A n]a,—►[. Ces deux ensembles 
sont ouverts dans A et constituent une partition de A : 
donc A n’est pas connexe. 

4 - L’ensemble Q des rationnels n’est pas un 
intervalle de IR : donc Q n’est pas connexe. 

Il existe de nombreuses propriétés des espaces 
topologiques que nous ne pouvons exposer ici, tel le 
fait d’être compact, ou encore le fait de posséder, en 
outre, une structure algébrique (groupe, anneau, 
corps, espace vectoriel), dans ce dernier cas, on dit 
qu’il s’agit d’un groupe topologique, d’un anneau 
topologique, etc. 

Les fonctions numériques. 

Toute application d’un ensemble E dans l’ensemble 
(R des réels est appelée une fonction numérique sur E. 
Les propriétés de ces fonctions sont liées aux proprié¬ 
tés de IR, et en particulier à*ses propriétés topologi¬ 
ques ; nous les avons déjà rencontrées en analyse, 
mais il est très séduisant de les aborder par la voie de la 
topologie générale. On peut ainsi retrouver d’une 
manière plus rigoureuse les notions de fonction mono¬ 
tone, de fonction connexe, de fonction continue de 
dérivabilité, etc. 

Topologie algébrique. 

Le point de départ de la topologie algébrique est 
l’étude des propriétés topologiques de certaines surfa¬ 
ces introduites par Riemann pour : représenter les 
fonctions d’une variable complexe (surfaces de Rie¬ 
mann) et d’autres figures du même genre appelées 
variétés. On a commencé (Poincaré) par décrire ces 
propriétés à l’aide de la topologie combinatoire et 
notamment de la notion d’homologie (voir ci-contre 
p. 130) ; puis — à partir des années 1920 — on a traité 
ces problèmes d’une manière algébrique, d’où l’ex¬ 
pression topologie algébrique pour désigner cette 
branche de la topologie. 

Il est impossible de présenter l’ensemble des théo¬ 
ries topologiques algébriques d’une manière suc¬ 
cincte. Les quelques remarques historiques faites 
pp. 128-129 éclairent le lecteur sur les domaines 
abordés. Pour les détails, il faut avoir le courage de se 
plonger dans les traités spécialisés, comme celui de 
W.S. Massey (édité par Harcourt, Brace et World, en 
1967) ou les Lectures on Algebraic Topology de 
M.J. Greenberg (Benjamin, 1967), auxquels nous 
renvoyons le lecteur. 
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On peut, certes, appliquer les résultats fondamentaux du calcul oes probabilités aux paris des joueurs ; mais la « doctrine des chances », comme on la nommait au XVIII e siècle, 
est une théorie très abstraite reliée aux aspects les plus délicats de l’analyse ou de la théorie des ensembles. 


CALCUL DES PROBABILITÉS 


RAPPEL HISTORIQUE. 


Le calcul des probabilités remonte aux travaux de 
Cardan, Pascal, Fermât et Huygens, qui élaborèrent 
les concepts de probabilité mathématique d’un événe¬ 
ment et d’espérance mathématique. La théorie des 
probabilités fut construite, sur ces bases, par Jacques 
Bernoulli ' (1705), Abraham de Moivre (1718) et par 
Laplace (1812). L’importance de la statistique, mise en 
valeur par les physiciens du XIX e siècle (notamment 
par Boltzmann, créateur de la physique statistique) 
ont conduit les mathématiciens à aborder les descrip¬ 
tions probabilistes à l’aide d’outils mathématiques 
hautement abstraits, comme la théorie de la mesure 
de Lebesgue ou la notion de fonction caractéristique 
(P. Lévy). L’axiomatisation de la théorie des probabili¬ 
tés a été l’œuvre de Kolmogorov (1933). Voici quelques 
points de repère historiques. 


Dates 

Événements 

XII e siècle 

Apparition du mot « hasart » dans la 
langue française commune ; emprunté à 
l’espagnol azar, lui-même issu de l’arabe 
az-zlr=«dé à jouer». Le jeu de dés, 
répandu dans le monde grec puis romain, 
disparut en Occident après les grandes 
invasions. Il fut réintroduit en France par 
les Croisés, sous le règne de Saint-Louis. 

Fin 

XVI e siècle 

De ludo aleae {Du jeu de hasard), traité 
posthume de Cardan, qui calcule la proba¬ 
bilité de divers coups (Cardan était un 
joueur de dés passionné). 

1654 

Correspondance entre Pascal et Fer¬ 
mât : établissement des notions de base 
concernant le « calcul des chances » (pro¬ 
babilités simples, probabilités composées, 
espérance mathématique), en rapport avec 
l’analyse combinatoire. 

1657 

Huygens : traité De ratiociniis in ludo 
aleae {Des raisonnements dans le jeu de 
dés), contenant la formulation du concept 
d’espérance mathématique : si, parmi N 
cas ayant tous la même chance de se 
produire, un joueur peut gagner a dans n 
de ces cas, et b dans les autres, son 
espérance mathématique de gain a pour 
valeur : 


_ na +{N - n) b 

~ M 


1705 

1708 

1713 

1718 

1738 


1733 

1763 

1771-1818 

1809-1823 

1837 

1846 

1851 

1887 

1903 

1908 


Jacques Bernoulli écrit son Ars conjec- 
tandi { Art de la conjecture), qui paraîtra 
posthume, en 1713. 

P. R. de Montmort : Essay d’analyse sur 
les jeux de hasard. 

Publication de VArs conjectandi de Ber¬ 
noulli, qui contient notamment la fameuse 
loi des grands nombres concernant la 
répétition d’un très grand nombre 
d’épreuves semblables. 

A. de Moivre : Doctrine of chances {La 
doctrine des chances) : énoncé de la règle 
des probabilités composées. 

Daniel Bernoulli (neveu de Jacques) 
étudie le problème connu sous le nom de 
« paradoxe de Saint-Pétersbourg » : deux 
joueurs A et B jouent à pile ou face ; si 
face est tiré au premier coup, A donne 
1 franc à B ; ... si face est tiré au n-ième 
coup, A donne 2 n 1 francs à B ; quelle est 
l’espérance mathématique de B ? L’appli¬ 
cation des règles de calcul des probabili¬ 
tés montre que cette grandeur devrait être 
infinie, ce qui est en contradiction avec le 
« bon sens ». C’est cette conclusion para¬ 
doxale qu’explique D. Bernoulli. 

Buffon introduit le calcul intégral dans 
le calcul des probabilités (« problème de 
l’aiguille »). 

Thomas Bayes : détermination de la 
probabilité des causes à partir des effets 
observés. 

Mémoires de Laplace sur le calcul des 
probabilités ; sa théorie générale est déve¬ 
loppée dans la Théorie analytique des 
probabilités (1812). 

Mémoires de Gauss sur la distribution 
des probabilités, la théorie des erreurs, 
etc. 

Poisson : formulation de la « loi des 
grands nombres » (formule de Poisson). 

Bravais : notion de corrélation (la théo¬ 
rie de la corrélation sera faite ultérieure¬ 
ment par Pearson). 

G. Boole : étude de la probabilité des 
causes (problème de Buyes). 

Cebyèev ; démonstration rigoureuse 
des lois de Laplace (théorie des erreurs). 

K. Pearson : théorie de la corrélation. 

E. Borel : Les probabilités dénombra¬ 
bles et leur application. 


1912 

1920-1925 

1933 

1935-1937 


Markov : généralisation de la démons¬ 
tration de Cebyèev. 

Travaux de Fischer (tests statistiques) ; 
théorie de l’estimation. 

Kolmogorov : axiomatisation du calcul 
des probabilités. 

P. Lévy : emploi de la fonction caracté¬ 
ristique d’une loi de probabilité. 


NOTIONS SUR LA THÉORIE 
DES PROBABILITÉS. 


Concepts fondamentaux. 

Probabilité d'un événement. 

• Définition. 

— Un événement aléatoire est un événement 
qui ne peut être prévu ; on dit aussi qu’il est dû au 
hasard. 

— La probabilité d’un événement est un nombre 
compris entre 0 et 1 qui mesure son caractère aléa¬ 
toire : c’est le rapport du nombre de cas favorables 
(apparition de l’événement) au nombre total des cas 
possibles, à condition que tous les cas soient considé¬ 
rés comme également probables. Poincaré notait que 
« la vérification de la réalisation de cette dernière 
condition est laissée au bon sens ». Ainsi : probabilité 
de tirer pile au jeu de pile ou face : p = 1/2 (1 cas 
favorable, 2 cas possibles) ; probabilité de tirer le cinq 
avec un dé : p = 1/6 (1 cas favorable, 6 cas possibles). 
Événement impossible : p = 0 ; événement certain : 
p = i. 

— La probabilité complémentaire d’un événe¬ 
ment A est la probabilité de voir apparaître l’événement 
contradictoire A'. Si p = n/N est la probabilité de A, 
celle de A' est 


Dans le cas de pile ou face : 

1 

p —q =- pour pile et pour face 

— Remarque : Le calcul de n (nombre de cas 
favorables) et de N (nombre de cas possibles égale- 


( 1 ) 

( 2 ) 
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ment probables) exige souvent que l’on utilise les 
formules de dénombrement données pp. 33-36 et que 
nous conseillons au lecteur de revoir. 

— Notation : la probabilité d’un événement E se 
note Pr{E) ; c’est un nombre p compris entre 0 et 1 : 

Pr(E) = p . 

• Théorèmes fondamentaux. 

— Théorème des probabilités totales : Si deux 
événements, A et B, de probabilités respectives Pr{A) 
et Pr(B) sont exclusifs l’un de l’autre (c’est-à-dire si 
l’occurrence « A et B» est impossible), la probabilité 
pour que l’un d’eux se produise est la somme des 
probabilités de chacun d’eux : 

Pr{A ou B) = Pr(A) + Pr(B). (3) 

— Théorème des probabilités composées : Si 
deux événements A et B sont indépendants, la proba¬ 
bilité pour qu’ils se produisent tous les deux est : 

Pr{A et B) = Pr(A) x Pr(B). (4) 

• Exemples. 

— Probabilité pour tirer au hasard une boule 
rouge ou une boule noire d’un sac comprenant 5 
boules rouges et 15 boules noires. 

Pr (boule rouge) = ^ ; Pr (boule noire) = ^ = | : 

donc : 

1 3 

Pr (boule rouge ou boule noire) = - 4- - = 1 = 

= certitude . (5) 

(Ce résultat est évident : comme il n’y a que des boules 
rouges et des boules noires dans le sac, la boule tirée 
sera, ou rouge, ou noire). 

— Sac ternaire comprenant 5 boules rouges, 15 
noires et 15 blanches, soit, au total, 35 boules. On 
demande Pr (boule rouge ou boule noire). 

L’événement « tirer une boule rouge » et l’événe¬ 
ment « tirer une boule noire » sont exclusifs ; on peut 
alors appliquer le théorème des probabilités totales : 

1 3 

. Pr (boule rouge) = - , Pr (boule noire) = - ; 

donc : 

4 

Pr (boule rouge ou boule noire) = - = 0,571 4... ( 6 ) 

— Probabilité de tirer deux fois de suite un 
numéro {par exemple le 17) à la roulette. 

Les deux événements sont indépendants, un coup 
de roulette n’ayant pas de rapport avec le coup précé¬ 
dent. On peut alors appliquer le théorème des probabi¬ 
lités composées. Comme il y a 37 numéros à la roulette, 
la probabilité de tirer le 17 est p = 1/37 ; la probabilité 
de tirer deux fois le 17 est : 


Pr (176117) = p xp = p 2 = -^L. ( 7 ) 

La probabilité de réussir une passe de trois (trois fois 
de suite le 17) serait p 3 = 1/50 653 (un peu moins de 
2/100 000). 

— Probabilité de faire 421 avec trois dés. 

La probabilité de, tirer l’une quelconque des faces 
d’un dé est p = 1/6. On peut faire 421 de six façons 
différentes. 


1 er dé 

4 

2 

1 

4 

1 

2 

2 e dé 

2 

1 

4 

1 

2 

4 

3 e dé 

1 

4 

2 

2 

4 

1 

Probabilité de 
la combinaison 

Pi 

P 2 

P 3 

P 4 

Ps 

Pe 


Calculons p , ; la série : « 4 avec le 1 er dé », « 2 avec le 
2 e dé », « 1 avec le 3 e dé » est une suite de trois 
événements indépendants, qui ont chacun la probabi¬ 
lité p = 1/6 ; donc : 


De même : 


Pi = P 3 


1 

216' 


P 2 ~ P 3 — P 4 — Pô — Pô 


1 

216' 


( 8 ) 


CONCEPTS FONDAMENTAUX DU CALCUL DES PROBABILITÉS 


D’autre part, chaque combinaison exclut les autres 
(si l’on fait 421, dans cet ordre, on ne fait pas 214, etc.) ; 
on peut donc appliquer le théorème des probabilités 
totales, puisque « 421 » peut être fait de six manières : 

P (« 421 ») = Pi “F P 2 P 3 ”1“ P 4 “F P 5 “F P 6 

6 1 

_ 216“ 36' (9) 


Variable aléatoire unidimensionnelle. 


Considérons un ensemble dont chaque élément peut 
être affecté d’un nombre, ce nombre étant déterminé 
par le hasard : chaque élément X est appelé une 
variable aléatoire. Une variable aléatoire est dite conti¬ 
nue si elle peut prendre toutes les valeurs réelles d’un 
intervalle donné ; elle est discrète dans le cas 
contraire. 


• Loi de probabilité et fonction de répartition. 

— On appelle loi de probabilité d’une variable 
aléatoire X toute relation permettant de déterminer la 
probabilité que la variable X prenne une valeur donnée 
quelconque, ou une valeur appartenant à un ensemble 
donné de valeurs. 

— La probabilité Pr(X < x) que la variable aléa¬ 
toire X soit inférieure à x est appelée fonction de 
répartition de la variable ; on l’écrit F(x). 

F(x)= Pr(X < x). (10) 

S’il s’agit d’une variable aléatoire discrète suscepti¬ 
ble de prendre les valeurs x 1f x 2 . x k avec les 

probabilités respectives p 1f p 2 , ..., p k , on a: 

F{Xj) = Pr(X < x,) = p., + p 2 H— + p,_ A . (11) 

— La dérivée f(x) de la fonction de répartition 
F(x) est appelée densité de probabilité : 


f(x) 


d F(x) 
dx 


( 12 ) 


f(x)dx est la probabilité élémentaire associée à dx 
telle que x<X<x + dx; on a évidemment : 

J f(x)dx = 1 (13) 

— Le nombre x p tel que : 
Pr{X<x p )^p^Pr(X^x p ) (0<p<1) (14) 

est appelé fractile d’ordre p. Le fractile d’ordre 0,5 est 
appelé valeur équiprobable ou médiane. 

— On appelle valeur dominante ou mode d’une 
variable aléatoire toute valeur pour laquelle la probabi¬ 
lité (ou la densité de probabilité si la variable est 
continue) a une valeur maximale. S’il y a un seul mode, 
la loi de probabilité est dite unimodale ; s’il y a deux 
modes, elle est bimodale ; s’il y a plusieurs modes elle 
est plurimodale. 

• Espérance mathématique. 

— Pour une variable discrète X, dont les valeurs 
x u x 2 , ..., x k sont affectées des probabilités p 1f p 2 , ..., 
p k , l’espérance mathématique E(X) est donnée par : 

E(X) = p 1 x 1 + p 2 x 2 + --- + p k x k = 2 P‘ x ‘ • (15) 

i 

— Pour une variable continue, l’espérance 
mathématique est définie par : 

E(X) = J xf(x)dx, (16) 

l’intégrale étant prise sur tout le domaine de variation 
de X. 

— Si E(X) = 0, la variable aléatoire est dite 
centrée. Si la variable X a pour espérance mathémati¬ 
que m, la variable centrée correspondante est X — m. 
— Exemples simples (variables discrètes). 

1 - Soit une loterie comprenant 1 000 billets et 
les lots suivants : 

1 lot x 1 = 10 000 F, 4 lots x 2 = 750 F, 5 lots x 3 = 100 F . 
A ces lots correspondent les probabilités suivantes : 

14 5 

P ’ _ 1 000 ’ Pz_ 1 000 ’ P3- 1 000 ’ * 17 * 


l’espérance mathématique totale pour la série considé¬ 
rée est : 

E = x 1 p 1 + x 2 p 2 + x 3 p 3 = 10 -F 3 + 0,5 = 13,5 (francs). 

Remarque : le total des lots vaut 

10 000 + 3 000 4 - 500 = 13 500 F ; chaque billet peut 
donc rapporter, en moyenne, 13 500/1 000 = 13,5 F : 
on retrouve E. 

2 - Un jeu est dit équitable, mathématiquement, 
si E = 0. Ainsi, à pile ou face, avec un enjeu unitaire de 
x francs, l’espérance mathématique de gain, pour un 
joueur qui choisit pile, est e., = x/ 2 (p = 1 / 2 ) ; son 
espérance mathématique de perte est e 2 = — x /2 (perte 
= gain négatif). L’espérance mathématique totale est 
E = e 1 + e 2 = 0 ; le jeu est équitable. 


• Fonction caractéristique. Soit X une variable 
aléatoire ; on appelle fonction caractéristique la 
fonction 

<p{u)= E{e iux ). (18) 

Pour une variable discrète, on a donc : 

< P (u)='Z e ,uxl Pi ( 19 ) 


et, pour une variable continue : 

<p(u) = f e iu * f(x) dx . ( 20 ) 


• Moments. 

— On appelle moment algébrique d’ordre q le 
nombre m q tel que : 

m q = E(X q ) (21) 

(pour g = 1 , on pose = m). 

— On appelle moment algébrique d’ordre q par 
rapporté une origine a le nombre noté a m q , défini par : 

a m q = E[(X — a) q ] ; (22) 

si l’on prend a = E(X), le moment a m q est appelé 
moment algébrique centré d’ordre q et s’écrit p q : 

P' q = E[(X — E(X)) q ] . (23) 

— On parle de moments absolus lorsqu’on 
considère, dans les formules (21), (22) et (23) les 
valeurs absolues I X q |, I (X - a) q I et I [X - E(X)] Q |. 

• Moyenne et écart-type. 

— La moyenne d’ordre q par rapport à une 
origine a est le nombre : 

= ^E[(X-a)<]. (24) 

— L 'écart-moyen d’ordre q est le nombre : 

</E[\{X-ay |]. (25) 

— La variance est le moment algébrique centré 
d’ordre 2 : 


\Z(x) = /x 2 =E[[X-E(X)] 2 ]. . (26) 

— L 'écart-type cr est la racine carrée de la 
variance : 

cr = VVM • (27) 

— La variable aléatoire réduite correspondant à 
X est la variable : 


X - m 


(28) 


m désignant l’espérance mathématique de X. 


Lois de probabilité. 


Épreuves répétées (variable discrète). 

• Nombre d’épreuves à tenter. 

Soit p la probabilité d’un événement aléatoire ; on 
démontre que : 

— le nombre moyen d’épreuves qu’il faut tenter 
pour que l’événement apparaisse au moins une fois 
est m = 1 /p ; 

— le nombre moyen d’épreuves qu’il faut tenter 
pour qu’il se réalise t fois est m t = t/p ; 

— le nombre moyen d’épreuves qu’il faut tenter 
pour qu’il se réalise s fois consécutives est 


M = 


1 

1 -p 



(1) 


Ainsi, il faut jeter en moyenne 2 fois une pièce pour 
qu’elle tombe au moins une fois sur pile (cela ne veut 
pas dire qu’on est certain d’obtenir pile en deux 
coups, mais que, sur une série de 1 000 coups, par 
exemple, on obtiendra environ 500 fois pile, soit une 
moyenne de succès qui tend vers 2 quand on 
augmente indéfiniment le nombre de coups). 

Pour faire une série de 10 pile, il faut jeter, en 


moyenne, M 


'-i 



= 2 045 fois une pièce 


en l’air (même remarque que ci-dessus). 


• Probabilité d’apparition d’un événement. 

— Soit p la probabilité de cet événement ; si l’on 
tente une série de N épreuves, quelle est la probabilité 
z pour que cet événement apparaisse au moins une 
fois ? On montre que l’on a : 

z = 1 - (1 - p) N ( 2 ) 

(si N = 1, on obtient, naturellement, z = p). 

Inversement, pour qu’un événement de probabilité p 
ait la probabilité z (^ p) d’apparaître au moins une fois, 
il faut faire : 


N = 7 ^- 77 — —7 épreuves . (3) 

ig(i - p) 
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LOIS DE PROBABILITE 


— Voici un début de table donnant N quand on 
connaît p et z : 


P 

1 

1 

1 

1 

1 

z 

2 

4 

6 

10 

100 

1 




1 

11 

10 






1 


1 

2 

3 

29 

4 






1 

2 

1 

3 

4 

7 

69 

3 

4 

2 

5 

8 

13 

138 

0,9 

4 

8 

13 

22 

230 

0,95 

5 

11 

17 

29 

299 

0,99 

7 

16 

26 

44 

459 

0,999 

10 

24 

38 

66 

688 


Par exemple, si l’on veut avoir 99 chances sur 100 
(z = 0 , 99 ) de tirer un as en jetant un dé (p as = 1 / 6 ), il 
faut jeter le dé 26 fois. De même, en jetant 10 fois de 
suite une pièce de monnaie en l’air, on a 999 chances 
sur 1 000 (z= 0,999) qu’elle tombe au moins une fois 
sur pile. 

• Nombre moyen d’apparitions d’un événement 
de probabilité p. 

— Si l’on fait un très grand nombre de séries de 
N épreuves, l’événement apparaît, en moyenne M fois, 
avec M = Np. 

Ainsi, si l’on jette 1 000 fois une pièce de monnaie en 
l’air et si l’on répète un très grand nombre de fois cette 
expérience, on obtiendra tantôt un peu moins de 
500 fois pile , tantôt un peu plus de 500 fois pile, mais, 
en moyenne, on obtiendra Np = 1 000 x 1/2 = 500 fois 
pile. 

• Dans une suite de K fois N épreuves ( K étant 
très grand), un événement de probabilité p peut appa¬ 
raître, sur N épreuves : 0, 1, 2,..., (N — 1), N fois. Mais 
les nombres d’apparitions n’ont pas tous la même 
probabilité de réalisation. Ainsi, si l’on jette 
N = 600 fois un dé, et qu’on recommence plusieurs 
fois ces 600 jets, il se peut que, dans une expérience, 
on ne tire pas un seul as, ou une seule fois un as sur 
600 jets, mais cette circonstance a très peu de chances 
d’être observée. Le nombre le plus probable d’appari¬ 
tions de l’as sera de 100 fois sur 600 jets. Plus généra¬ 
lement, le nombre le plus probable d’apparitions d’un 
événement est n = Np, si Np est un entier ; si Np n’est 
pas un entier, on forme la somme Np+ p, et alors : 

• ou bien (Np + p) est un entier, et il y a deux 
nombres d’apparitions également probables : 
n = Np + p et n' = Np + p - 1 ; 

• ou bien (Np + p) n’est pas un entier, et l’on 
prend l’entier immédiatement inférieur à Np + p si 
p < 1 / 2 , l’entier immédiatement supérieur si p > 1 / 2 . 

— La probabilité pour qu’il y ait n apparitions 
de l’événement en question est : 

S»0 = - - 1- =. (4) 

V 2 nNp (1 - p) 

Lorsque p = (1 — p), comme dans le jeu de pile ou 
face, on a : 



(5) 


Loi de Laplace-Gauss (= loi normale). 

Soit X une variable aléatoire continue et soit x un 
nombre réel quelconque, la probabilité pour que X soit 
inférieur à x est la fonction de répartition F(x) définie 
ci-dessus. On peut déterminer cette fonction à partir de 
sa dérivée f(x), c’est-à-dire de la densité de probabilité. 
Laplace et Gauss ont étudié le cas où cette fonction est 
donnée par : 



dans laquelle m est l’espérance mathématique ou 
moyenne de la distribution et cr l’écart-type (voir 
définition p. 133). 

Si l’on effectue le changement de variable : 


CT 



Un bon joueur de bridge n’a pas besoin d’être mathématicien, mais il se sert des résultats des calculs faits par 
des mathématiciens probabilistes. Voici un exemple simple : vous disposez, avec votre partenaire, supposé 
mort, de 8 cartes dans une couleur ; vos adversaires possèdent donc, à eux deux, 5 cartes, qui peuvent être 
réparties 3-2, 4-1 ou 5-0. Ces trois répartitions ont respectivement pour fréquence d’apparition théorique : 

68 %, 28% et 4 %. 


la loi de Laplace-Gauss s’écrit : 

f(u) = —L= exp (- — ) (8) 

V2 -IT V 2 / 

avec - oo < u < + oo : c’est la loi normale réduite. 


Loi binomiale et loi de Poisson. 

• La loi binomiale donne la probabilité 
Pr(X= x) pour que la variable aléatoire discrète X 
prenne la valeur x, x étant égal à 0 , 1 , 2 , ..., n : 

Pr (X =x)= ( ” J p*(1 -p)"'* , (9) 



étant le nombre 


de combinaisons de n éléments 


pris x à x, soit (voir p. 34) : 


Autres lois de probabilité. 

• Loi hypergéométrique. C’est la loi : 



dans laquelle x est la valeur (entière) de X 
( x = 0,1,2,...), N l’effectif de la population étudiée, 
d une partie de N possédant un caractère particulier, et 
n l’effectif d’un échantillon. 

• Loi log-laplacienne. Elle concerne une varia¬ 
ble continue X, variant de a à l’infini : 

,, % 1 [ J \ f\ n(x -a)-m 

f(x) = -exp -- —---- 

(x — a) ci V2 TT L 2 \ 5 




Lorsque, dans une suite de n épreuves indépendan¬ 
tes, la probabilité d’un événement E est constante et 
égale à p pour chaque épreuve, la probabilité pour que 
cet événement se produise x fois au cours de ces n 
épreuves est donnée par la loi binomiale (voir pp. 133- 
134). 

• Loi de Poisson. Soit m l’espérance mathéma¬ 
tique de la variable X, on a aussi, pour x = 0,1,2,... : 

Pr (X = x) = e m r. C* 1 ) 

x ! 

Ce résultat constitue la loi de Poisson. 


• Loi exponentielle (pour une variable continue 
variant de 0 à + oo) : 

f(x) = A e~ Ax (À > 0). (14) 


Variables k-dimensionnelles. 

Au lieu de caractériser les individus d’une population 
par une seule variable X, on peut leur affecter deux 
variables aléatoires (X, Y), trois, quatre, ..., k variables 
aléatoires. On peut alors définir une loi de probabilité 
/(-dimensionnelle, une fonction de répartition 
/(-dimensionnelle, etc. Les fonctions qui interviennent 
ici sont des fonctions de plusieurs variables réelles. 
Nous ne les étudierons pas ici. 
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ANNEXE « MATHEMATIQUES » 


LA NUMÉRATION GRECQUE. 

Les Grecs ont connu et utilisé trois systèmes de numération : 

1 - Le système attique est un système vulgaire, qui s’est 
prolongé jusqu’à l’époque hellénistique et romaine ; il est 
analogue au système romain, encore usité de nos jours 
(« Louis XIV », « Chapitre IV » ; « le XVIII e siècle », etc.). 

2 - Le système dit des lettres numérales apparaît dans les 
textes scientifiques au IV e siècle ; c’est le système savant, 
largement emplové dans les textes scientifiques à partir du 
III e siècle. 

3 - Archimède a perfectionné le système précédent et en a 
proposé l’utilisation dans un opuscule intitulé L’arénaire. 

Système attique. 

Les nombres sont notés à l’aide de lettres, initiales des noms 
de nombres en grec. Le système est de juxtaposition : 

1 = 1 ; 

11 = 5; 

A = 10 ; 

H = 100 ; 

X = 1 000 ; 

M = 10 000 (une myriade). 

Exemples : 

13 = A I I I. 

48 = A A A A II I I I. 

50 = fÂl (5 fois 10). 

500 = P (5 fois 100). 

1979 = MIHlHHHH[ÂlAAnilll. 

On rencontre aussi P au lieu de fÂl ; F pour 500 ; 
F pour 5 000 et F pour 50 000. 

Numération savante. 

Signes employés : les 24 lettres de l’alphabet grec classi¬ 
que, augmenté de trois lettres anciennes : 

F (digamma) lj ( koppa) cttt {sampi : cr + tt) 

Toutes ces lettres sont suivies de l’accent « ' » pour ne pas 
être confondues avec les lettres servant à écrire les mots. On a 
ainsi : 


Unités 

Dizaines 

Centaines 

a' = 1 

l' = 10 

p' = 100 

P' = 2 

k' = 20 

<y = 200 

Y = 3 

A' = 30 

t' = 300 

8' = 4 

|x' = 40 

u' = 400 

e' = 5 

v' = 50 

<p' = 500 

F' = 6 

r = 60 

X' = 600 

£' = 7 

o' = 70 

i|V = 700 

y = 8 

t t' = 80 

Ci)' = 800 

0' = 9 

// ' = 90 

(ttt' = 900 


Pour les milliers , on utilise les lettres des unités simples en 
plaçant l’accent en bas et à gauche de la lettre: ,a = 1 000, 

= 2 000, etc. jusqu’à ,6 = 9 000. Exemples : 

a/ £' F 7 = 800 + 60 + 6 = 866 . (1 ) 

,0 cnr'^'0'= 9 999 (le plus grand nombre qu’on puisse écrire 
avec ce système). 

Pour les nombres supérieurs à 10 000, divers systèmes ont 
été proposés, notamment celui d’Apollonius : la lettre M 
(initiale de murias= myriade = 10 000) placée après un nom¬ 
bre signifie que ce nombre représente des dizaines de milliers 
(des myriades). Exemple : 

ü>' F' M = 866 myriades = 8 660 000 . (2) 

Avec cette convention on peut écrire tous les nombres jusqu’à 
100 millions (10 8 ), ce dernier étant exclu. Le plus grand 
nombre « représèntable » est donc : 

,0oV l / ' 0' M ,00-17' l \ ' 0' = 99 999 999 (10 8 - 1 ). (3) 

Quant aux fractions, les Grecs les écrivaient différemment 
selon qu’il s’agissait de fractions dont le numérateur était égal 
à l’unité ou de fractions quelconques. Des nombres tels que 
1/3, 1/4, etc., étaient représentés par les lettres désignant 3, 
4, ... suivies d’un double accent : « " » ; ainsi : 

V = §, e” = g. (4) 

Les fractions « ordinaires », comme 5/7 ou 29/13 s’écrivaient 
ainsi, à l’aide d’une «barre», ancêtre de notre «trait de 
fraction » introduit par les Arabes : 

f' £' k'0'i'y'. (5) 

Système d'Archimède. 

Les nombres inférieurs à 10 8 sont notés comme ci-dessus ; 
ils constituent ce qu’Archimède appelle les nombres du 
premier ordre ; pour les 10 8 nombres suivants (de 10 8 à 10 16 ), 


Archimède propose de les compter à nouveau 1, 2, 3, ..., mais 
en les nommant nombres du deuxième ordre (2 signifie donc, 
si l’on précise qu’il s’agit d’un nombre du deuxième ordre : 2 
unités du deuxième ordre, soit 2 fois 10 8 ; et ainsi de suite, 
jusqu’à 10 8 unités du deuxième ordre, c’est-à-dire jusqu’au 
nombre 10 16 ). De même, les nombres de 10 16 à 10 24 sont les 
nombres du troisième ordre, etc... Il en ira ainsi jusqu’au cent 
millionième ordre, qui se termine au nombre 
100 000 OOO 100000000 , soit 10 8 élevé lui-même à la puissance 10 8 . 
On parvient ainsi à la fin de la première période (selon la 
terminologie d’Archimède). Ce dernier terme, soit 
(100 000 OOO) 10 , devient alors l’unité de la seconde période, et 
ainsi de suite, sans qu’il soit nécessaire de s’arrêter. Pour fixer 
les idées : le dernier nombre du cent millionième ordre de la 
cent millionième période s’écrirait, dans notre numération 
décimale, avec 80 000 millions de millions de chiffres; et il 
pourrait servir lui-même d’unité pour une autre série. Ainsi 
donc, en utilisant uniquement les 27 signes numériques cités 
plus haut, mais en leur assignant un ordre à l’intérieur 
d’une période (et, si l’on veut, une période à l’intérieur d’une 
« super-période » et ainsi de suite à l’infini), Archimède mon¬ 
trait qu’on pouvait écrire n’importe quel nombre, aussi grand 
fût-il, même si ce nombre devait être supérieur « non seule¬ 
ment au nombre de grains de sable capable de remplir toute la 
Terre, mais encore à la masse de sable égale en volume à tout 
l’Univers », déclare-t-il dans L’arénaire (ce titre est dérivé du 
titre latin de l’œuvre d’Archimède ; arena = « sable »). 


LES MATHÉMATICIENS ARABES. 

(Nous avons adopté, rappelons-le, les règles de translittéra¬ 
tion recommandées par l’ Organisation internationale de nor¬ 
malisation ; on a indiqué entre parenthèses la transcription 
usuelle — mais incorrecte — de certains noms de savants dont 
les œuvres sont connues en Occident depuis le Moyen Age ; 
« b. » est une abréviation pour ibn et signifie « fils de ».) 

Le IX e siècle. 

• Muhammad b. Musa al-H_ w ârizmï (al-Khwarezmi ou 
al-Khwarizmi, ou Mohammed ben Mousa en Occident). Ce 
fondateur de la mathématique arabe a vécu à la fin du 
VIII e siècle et au débjjt du IX e siècle, à la cour du calife al-Ma” 
mün, qui régna à Bagdad de 813 à 833, successeur de son père 
Harun ar-Rasïd (Haroun al-Rachid). On lui doit : 1° un manuel 
d’arithmétique (perdu et connu par une copie incomplète du 
XIII e siècle) dans lequel il introduit le système indien de 
numération, ultérieurement qualifié improprement « arabe » ; 
2° des tables trigonométriques donnant les sinus (traduites en 
latin par Adélard de Bath en 1126) ; 3° des tables astronomi¬ 
ques ; 4° des travaux géodésiques et géographiques ; 5° un 
traité d’algèbre qui est le grand monument de la mathématique 
arabe, composé vers 850, et dont le titre complet est : al-Kitâb 
al-muhtasar fî hisâb al-ÿabr wa-l-muqâbala, d’où provient le 
mot « algèbre »* ( al-gabr). 

Dès le X e siècle on appelle al-ÿabriyyün ceux qui emploient la 
méthode de I ’al-ÿabr wa-l-muqâbala. L’œuvre est connue 
des Occidentaux par une traduction latine partielle de Robert 
de Chester ( Liber algebrae et almucabola, 1145) puis de 
Gérard de Crémone (v. 1114-1187). 

• Muhammad b. 'Tsâ Abü'Abd Allah al-Mâhânï (v. 860). 
Géomètre et astronome de Mahan (actuellement Kermân, en 
Iran). Il a entrepris une critique de la théorie des proportions et 
montré que le problème archimédien de la division de la 
sphère (couper une sphère par un plan de sorte que le rapport 
des volumes des deux segments sphériques obtenus ait une 
valeur donnée) se ramenait à la résolution d’une équation de la 
forme x 3 + r = px 2 (« équation d’al-Mâhànï »). 

• Tàbit b. Qurra al-Harràni (v. 826-901). Astronome et 
mathématicien qui dirigeait une école de traducteurs (à partir 
du grec) à Bagdad ; il a lui-même traduit VIntroduction à 
l’arithmétique de Nicomaque. Tàbit a été le plus grand mathé¬ 
maticien arabe du IX e siècle après al-H w àrizmï ; on lui doit : la 
théorie des nombres amiables (couples de nombres 
dont chacun est égal à la somme des diviseurs de l’autre ; une 
méthode pour calculer l’aire d’un segment de parabole, qui 
annonce le calcul intégral ; d’importants travaux astronomi¬ 
ques (y compris une révision de la traduction de I Almageste 
Ptolémaïque). 

• Ahmad b. Yüsuf(7-\i. 912). Géomètre égyptien, auteur 
d’un traité* sur la théorie des proportions. 

Le X e siècle. 

• Abu Kâmil ÔuQâ f (fin IX e -début X e ). On ignore tout de 
la vie de ce mathématicien qui travailla au Caire et qui fut la 
plus grande figure mathématique du X e siècle islamique (son 
florujt se_situe aux environs de 900). Continuateur d’al-H^à- 
rizmi, Abu Kamil a développé la théorie des équations du 
second degré et de la théorie des nombres, et traité de la 


solution intégrale d’équations indéterminées (« analyse 
diophantine »). Son influence sur les mathématiciens occiden¬ 
taux a été très grande ; elle s’est exercée par l’intermédiaire de 
Leonardo Fibonacci (Léonard de Pise, v. 1175-apr. 1240), qui 
introduit le système de numération « arabe » en Occident, ainsi 
que les méthodes algébriques. 

• Sinan b^ Tàbit (t 943). Mathématicien, physicien et 
astronome de Bagdad. 

_• 'AIT b. Ahmad al-'ImrânT (t*v. 955). Commentateur 
d’AbïJ Kâmil, à Mossoul ; il s’est surtout illustré comme 
astrologue. 

• Ihwân as-Safâ'. Ce terme, qu’on traduit habituellement 
par « Frères de la Pureté », désigne une secte scientifico- 
religieuse, plus ou moins réservée à des initiés, fondée dans le 
dernier quart du X e siècle, et dont les auteurs ont rédigé 
52 Épîtres (r/sa/a) dont l’ensemble constitue une sorte d’ency¬ 
clopédie. 

• Abüga'far al-Hàzin (t v. 965). Astronome et mathéma¬ 
ticien de Hurasan (Khorassan), en Iran. A notamment résolu 
l’équation d’al-MàhânT. 

• Sahl ad-Dïn al-KühT (v. l’an 1000). Mathématicien 
irano-arabe qui a étudié les équations d’un degré supérieur à 2. 

• AbiT l-Fath (vers l’an 980). Mathématicien et astro¬ 
nome d’Ispahan. 

• AbTI l’-Wâfa' al-BUzÿânï (960-997 ou 998). Mathémati¬ 
cien de l’École de Bagdad, commentateur d’Euclide, de Dio¬ 
phante et d’al-H w àrizmï, auteur d’un traité sur les constructions 
géométriques et de travaux trigonométriques (calcul de sinus à 
10' 8 près, à l’aide de méthodes d’interpolation). 

• HamTd b. al-Hidr al-HupandT (t v. 1000). Mathémati¬ 
cien qui s’est intéressé à la théorie des nombres : il a montré 
que la somme de deux cubes ne peut être un cube. 

• Maslama b. Ahmad (t v. 1007). Mathématicien et 
astronome originaire de’ Madrid et établi à Cordoue. 

Le XI e siècle. 

• Abu r-Rayhân Muhammad b. Ahmad al-BTrünï 
(973-1048, connu en Occident sous le nom d’al-Biruni ou 
al-Bireni). L’une des plus grandes figures de la science et de la 
philosophie islamiques, d’origine iranienne (né à Kât dans le 
H w ârizm — le « Kharezm » des Occidentaux — au Sud de la mer 
d’Aral). Il passa la première partie de sa vie dans sa patrie et en 
divers lieux de l’Iran, puis il suivit le sultan ghaznawide (de 
Gazna, ville de l’Afghanistan oriental) Mahmüd b^Sebüktigin 
dans ses expéditions en Inde et à la cour de Gazna, où il 
mourut. On lui doit des travaux originaux et nombreux dans 
tous les domaines scientifiques et anthropologiques ; il a 
échangé une importante correspondance avec Avicenne son 
cadet de sept ans. En mathématiques, on retiendra, parmi une 
quinzaine de titres, son traité intitulé Kitàb at-tafhîm li-awâ' il 
sina 'at at-tanâ/im. Les questions qui l’ont plus spécialement 
intéressé concernent : la théorie des proportions, le calcul 
trigonométrique, la cinématique (notions de vitesse à un 
instant donné et d’accélération). 

• Les mathématiciens espagnols sont cités ici pour 
mémoire : Ibn as-Samh, de Grenade (9797-1035) ; al-Karmànï, 
de Cordoue (v. 976-10Ô6), introducteur des théories des Frères 
de la Pureté ; Ibn Abï r-Rigàl (Abenragel des Occidentaux), de 
Cordoue/Tunis (v. 1020-1040) ; Ibn as-Soffàr, de Cordoue 
(t 1035); Yüsuf al-Mu’tamin, roi de Saragosse (+ 1085). 

• Abu l-Hasan KUèyâr b. Labbân al-ôJIT (fin X e -début 
XI e siècle ; connu en Occident sous le nom de Kushyar ben 
Labban). Mathématicien originaire du Sud de la Caspienne, 
auteur d’une introduction à l’arithmétique indienne (vers 1000). 

• 'Umar Hayyâm (en Occident, connu sous le nom 
d’Omar Khayyam ; v. 1038-1123). Poète et mathématicien 
iranien f Umar üayyâm a travaillé à Boukhara et à Ispahan. On 
lui doit un traité d’algèbre (1074), dans lequel il développe la 
théorie des équations d’al-H w ârizmT et propose une solution 
géométrique des équations du troisième degré ; des Commen¬ 
taires sur les Éléments d’Euclide (1077), avec une généralisa¬ 
tion abstraite de la notion de nombre ; divers travaux d’arith¬ 
métique, de géométrie et d’astronomie et notamment une 
réforme très précise du Calendrier (1075). 


Le XII e siècle et le XIII e siècle. 

Le XII e siècle. 

C’est un siècle important pour le développement de 
l’influence de l’Islam en Occident : les traductions de l’arabe 
en latin, ou de l’arabe en hébreu puis en latin se multiplient 
(Adélard de Bath, déjà nommé, Robert Chester, Gérard de 
Crémone, Jean de Séville, Ecole de Tolède, etc.). Les historiens 
séparent nettement, à cette époque, les savants d’Orient et 
ceux d’Occident (Afrique du Nord maghrébine, Espagne, 
Séville, Italie). Tous les grands mathématiciens arabes du 
XII e siècle sont orientaux, notamment Muhammad b. Ahmad 
al-Haraqi ( + 1138 ou 1139), f Abd al-Malik aè-STrazï (v. 118Ô) ; et 
le géomètre Muhammad b. al-Husayn (v. 1190). 
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Le XIII e siècle. 

• al-Muzaffar b. Muzaffar at-TüsT (al-Tousi ou et-Tousi 
des Occidentaux, t v. 1213). Inventeur de l 'astrolabe linéaire 
ou « bâton d’al-Tousi ». 


• Ibn al-Bannâ'al-MarrâkuèT (1256-1321). Savant maro¬ 
cain (le seul mathématicien maghrébin du XIII e siècle), qui 
s’est occupé de philologie, d’exégèse, de rhétorique, d’astro¬ 
nomie et de mathématiques. Son mérite principal est d’avoir 
contribué à maintenir et à vulgariser le calcul en chiffres dits 
gubar( mot qui signifie « poussière ») : le calculateur répandait 
de la poussière sur une planchette (taht) et dessinait les 
chiffres à l’aide d’un bâtonnet. Pour effacer un résultat partiel, 
on le recouvrait d’ur^peu de poussière. Ce type de calcul est 
appelé hisab al-gubar. 

• Nâsir ad-DTn at-TüsT (<< al-Tusi » en Occident, 
1201-1274). Mathématicien et astronome, qui fonda et dirigea 
l’observatoire de Maràga (Azerbaïdjan) en 1259 (l’Ecole de 
Maràga, où travaillaient des savants chinois et musulmans, a 
combattu la tradition astronomique de Ptolémée et prépara la 
révolution copernicienne). On doit à ce savant de nombreuses 
découvertes et démonstrations : méthode d’extraction d’une 
racine n-ième, formule du binôme (a + b) " jusqu’à n = 12 
(triangle de Pascal), un examen de la théorie euclidienne des 
droites parallèles, un traité de trigonométrie (y compris la 
trigonométrie sphérique), etc. Son influence sur les mathéma¬ 
ticiens occidentaux (notamment sur Regiomontanus qui a 
développé le calcul trigonométrique en 1533) a été très 
importante. 

Déclin de la science arabe. 


Ce déclin se dessine dès le XIV e siècle et s’affirme d’une 
manière générale à partir du XV e siècle. Les principaux mathé¬ 
maticiens de cette période furent l’Algérien Ibn al-Qunfüd 
(t en 1407 ou 1408), qui f[t progresser l’usage des symboles en 
algèbre et chez al-Qalasàdi (t 1486) juriste et mathématicien 
de Grenade, commentateur d’Ibn al-Banna’ et auteur d’un très 
grand nombre d’ouvrages d’arithmétique et d’algèbre. Il a 
notamment perfectionné les symboles algébriques en utilisant 
les lettres suivantes : 
c4(è) : x (l’inconnue d’une équation) : 

J ('):=; 

I* (rn) : x 2 ; 

(fc) : x 3 ; 

£ (Ô): VT 


ARITHMÉTIQUE ÉLÉMENTAIRE 
ET CALCUL ALGÉBRIQUE 
CLASSIQUE. 


Arithmétique élémentaire. 

La numération. 

• Le problème. 

La numération est la méthode selon laquelle on représente 
les éléments de l’ensemble N, c’est-à-dire les entiers naturels. 
On pourrait, par exemple, désigner chacun d’entre eux par un 
signe particulier: mais on épuiserait bien vite les possibilités 
de l’imagination humaine et, de plus, ces signes particuliers ne 
se prêteraient pas au calcul. Nous avons vu que les peuples de 
l’Antiquité ont proposé des systèmes variés, plus ou moins 
ingénieux, plus ou moins commodes, reposant, pour la plu¬ 
part, sur le principe de juxtaposition, qui est celui — entre 
autres — de la numération romaine (les Romains en ont été les 
héritiers et non pas les créateurs). Résumons le système 
romain. 

— L’unité est représentée par un I ; on écrit ensuite 
autant de barres qu’il y a d’unités : I (un), Il (deux), III (trois), llll 
(quatre, qui peut aussi s’écrire autrement). 

— Le nombre cinq s’écrit V ; il représente une collection 
de cinq I ; à partir de V, il est possible d’écrire de nouveaux 
nombres avec la convention suivante : le I placé avant le V 
signifie qu’il faut le soustraire de V, les I placés après le V 
doivent être ajoutés à V. On a donc : IV (quatre), V (cinq), VI 
(six), VII (sept), VIII (huit). 

— Dix s’écrit X ; on peut lui adjoindre des I avec les 
mêmes règles que pour V ; on a donc : IX (neuf), X (dix), XI 
(onze), XII (douze), XIII (treize), puis toujours en additionnant 
les signes : XIV (dix plus quatre, soit quatorze), XV (quinze), 
XVI, XVII, XVIII. 

— Une collection de X permet d écrire vingt, trente, 
quarante, etc. : XX, XXX, XXXX, etc. 

— les autres signes sont : L (cinquante), C (cent), D 
(cinq cents), M (mille). Un nombre comme mille neuf cent 
soixante-douze s’écrit : MCMLXXII (le C devant le M doit se 
soustraire du M, comme le I devant le V ou le X). 

Ce système est très lourd et très peu commode. Toutes les 
opérations que nous faisons automatiquement avec le système 
décimal de position (retenir 2, poser 3, faire des produits 
partiels, etc.) deviennent très vite des calculs inextricables, qui 
ne peuvent être menés à bien qu’avec l’utilisation de tables 
numériques. 

Ce sont, on l’a vu, les Hindous et les Arabes qui, trois mille 
ans après les Mésopotamiens, ont redécouvert le système de 
position, qui permet d’écrire n’importe quel nombre avec un 
nombre réduit de signes, toujours les mêmes, dont la valeur 
dépend de leur position, de leur rang. 

• Numération dans un système de base B. 

La méthode moderne de numération, inventée par les Sumé¬ 
riens et perfectionnée par les Hindous et les Arabes, puis par 
les arithméticiens de la Renaissance, consiste à écrire un 


nombre x quelconque à l’aide d’un petit nombre de signes 
appelés chiffres ou signes numériques, qui comprennent au 
minimum deux signes, 1 pour l’unité, 0 pour zéro unité, mais 
qui peuvent en comporter beaucoup plus (notre système usuel, 
très encombrant, en compte dix). 

On démontre, en arithmétique, qu’un entier quelconque x, 
supérieur à 1, peut s’écrire sous la forme d’une somme de n 
termes : 

x = a n .! B n_1 + a n _ 2 B n ~ 2 + ••• + 

+ a n p B n p + ••• + a 2 B 2 + a, B + a 0 . 

B s’appelle la base du système ; on le représente conven¬ 
tionnellement par 10, quel que soit l’entier B (si B = deux, on 
représentera le nombre deux par 10 ; si B = trois, on représen¬ 
tera le nombre trois par 10 ; etc.). Si B = dix, on représentera 
le nombre dix par 10 : c’est d’ailleurs notre système usuel ; si 
B = douze, on représentera douze par le symbole 10, et ainsi 
de suite. Les nombres a n _ 1 , a n _ 2 , ..., a 2 , a 1f a 0 sont tous 
inférieurs à B et a n _ 1 est différent de 0. 

Si le nombre x est compris entre B" -1 et B n , il y aura n 
nombres de la forme a n ^ ; pour représenter x, il n’est pas 
nécessaire d’écrire la somme ci-dessus : il suffit d’écrire, de la 
gauche vers la droite, les nombres a n _ 1t a„_ 2 .... 

En résumé, dans un système de base B : 

— la base B est représentée par 10, quel que soit B ; 

— le nombre x tel que B n >x^ B"” 1 se représente avec 
n signes (chiffres), dont le premier, a n _„ est obligatoirement 
différent de zéro ; les autres peuvent être tous nuis ; de toute 
façon ils sont tous inférieurs à B. 

— on écrit alors : 

x = a n _! a„_ 2 ... a 2 a, a 0 , 

cette notation représentant l’entier x dans le système de base 
B. 

• Application : le système décimal. 

La base B représente, ici, une dizaine (par exemple les dix 
doigts des deux mains). Les chiffres de ce système sont les 
nombres inférieurs à dix, soit : 

un = 1, deux = 2, trois = 3, quatre = 4, cinq = 5, six = 6, 
sept = 7, huit = 8, neuf = 9. A ces signes s’ajoute le chiffre 0 
(zéro). 

— Soit à représenter un nombre inférieur à B ; il suffit 
d’utiliser l’un des neuf signes. Par exemple, le nombre de 
pattes d’un cheval est représenté par 4, le nombre de voyelles 
dans l’alphabet français par 6, le nombre des Muses dans 
l’Antiquité par 9, etc. 

— Le nombre dix est représenté par B = 10. 

— Soit enfin un nombre supérieur à B, par exemple le 
nombre d’œufs qu’il y a dans une grosse (douze douzaines, 
soit cent quarante-quatre œufs). Nous avons, en appelant x ce 
nombre et en le comparant aux puissances successives de B : 
B (dix) = 10, B 2 (dix fois dix) = 10 2 = 100, B 3 (dix fois 
B 2 ) = 10 3 = 1 000 ; d’après l’inégalité double B 3 > x ^ B 2 , on 
voit qu’il faudra n = 3 chiffres pour représenter le nombre x. 
On aura donc : 

x = a 2 B 2 + a 1 B + a 0 , 

avec a 2 = 1 (une centaine), a 1 = 4 (quatre dizaines) et a 0 = 4 
(quatre unités simples). 

Finalement, on écrit : 

x = a 2 a 1 a 0 = 144 . 

— Un nombre comme B" s’écrit avec un 1 suivi de n 

zéros. 

— Remarque : chaque signe (chiffre) s’interprète en 
fonction de son rang. Le rang zéro est celui des unités simples 
(ici, il y a 4 unités simples) ; le chiffre occupant, dans le sens de 
droite à gauche, le premier rang après le rang zéro est le chiffre 
des dizaines (des B-aines d’une façon générale) : il représente 
les unités du premier ordre. Le chiffre occupant le deuxième 
rang après le rang zéro (en allant de la droite vers la gauche) 
représente les unités du deuxième ordre (ici : les centaines) ; 
... le chiffre occupant le n-ième rang représente les unités du 
n-ième ordre, etc. 

Le système décimal est notre système usuel. Il est commode 
dans la mesure où il permet de « compter sur ses doigts » ; 
mais il est encombrant, puisqu’il exige dix signes numériques. 
En outre, il présente un certain nombre de défauts du point de 
vue de la divisibilité (voir ci-après, p. 138). 

• La numération binaire. 

C’est la plus simple de toutes. La base du système est 
B = deux et s’écrit, conformément à la règle générale, B = 10. 
Puisque la base B est égale à deux, il n’y aura que deux signes 
numériques, 0 et 1. On aura, successivement : 

B 2 = quatre, B 3 = huit, B 4 = seize, etc. 

— Soit à représenter un nombre inférieur à B : on utilise 
l’un des deux signes ; exemples : 

nombre de têtes d’un cheval = 1 ; 
nombre de cornes d’un cheval = 0. 

— Le nombre deux est représenté par 10 ; exemple: 
nombre d’oreilles d’un cheval = 10. 

Comme nous sommes habitués, depuis notre plus tendre 
enfance, à nous exprimer en système décimal, cette manière 
d’écrire risque de nous induire en erreur dans un texte courant. 
Il faudrait donc préciser : « 10 dans le système binaire » pour 
ne pas confondre avec « 10 dans le système décimal ». Dans la 
suite de cet exposé, quand les nombres à transcrire seront 
exprimés dans le système décimal (qui est celui que tout le 
monde sait lire et comprend), nous utiliserons des caractères 
gras, les notations binaires (ou autres) seront en caractères 
maigres. Ainsi : 

deux f s’écrira 10 en système binaire, 

\ s’écrira 2 en système décimal, 

d’où 2 = 10, et ainsi de suite. 


— Les puissances successives de deux, B 2 , B 3 , B\ ... 
s’écriront avec deux zéros, trois zéros, quatre zéros,... 2 = 10 , 
2 2 = 100 , 2 3 = 1 000 , 2 4 = 10 000 , ... 

— Pour transcrire un nombre en système binaire, on 
applique les règles théoriques énoncées plus haut. Ainsi le 
nombre cinq (en notation décimale : 5), que nous nommerons 
provisoirement x, est tel que : 

B 3 > x 5= B 2 ; 

il s’écrit donc avec n = 3 chiffres (qui ne seront que des 0 ou 
des 1 ), le chiffre du troisième rang à partir de la droite (unités 
du deuxième ordre) étant obligatoirement un 1 , puisqu’il ne 
peut être un 0. On a : 

x = 4 + 1 = B 2 + 1 , 

donc, en binaire : 

x= 100 + 1 = 101 , 

d’où 


5 = 101 . 

— Un procédé commode consiste à écrire le nombre à 
transcrire en haut d’une colonne, en notation décimale ; on le 
divise une première fois par 2 et l’on écrit le quotient de cette 
division sous le nombre à transcrire, le reste (qui est 0 ou 1 ) 
étant inscrit en face de ce nombre ; on recommence la même 
opération pour le quotient obtenu, et ainsi de suite jusqu’à ce 
qu’on obtienne un. quotient nul et un reste égal à 1 . Il suffit 
alors de lire de bas en haut la colonne des restes pour avoir la 
transcription binaire du nombre décimal d’où l’on est parti. 

Exemple : Soit à transcrire 157 en binaire ; on a : 157 divisé 
par 2 donne comme quotient 78 et comme reste 1 ; 78 donne 
comme quotient 39 et comme reste 0 ; etc. : 


157 1 

78 0 
39 1 
19 1 

9 1 

4 0 
2 0 
1 1 
0 


157 = 10011101 . 


(Ce procédé est général ; voir ci-dessous). 

— Pour transcrire en notation décimale un nombre écrit 
en système binaire, il suffit d’additionner les unités des divers 
ordres, comme ceci : 


Ordres 

8 e 7 e 6 e 5 e 4 e 3 e 2 e 

1 er 

unités 

sim¬ 

ples 

Nombre 

d’unités 

10 0 111 

0 

1 

Équivalent 

décimal 

2 7 x 1 2 6 x 0 2 5 x 0 2 4 x 1 2 3 x 1 2 2 x 1 2 x0 

1 


Le nombre 10011101 s’écrit donc, en système décimal : 

2 7 + 2 4 + 2 3 + 2 2 + 1 = 128 + 16 + 8 + 4 + 1 = 157. 

(Pour les règles opératoires en système binaire, voir ci-des¬ 
sous, p. 137). 


• Base quelconque. 

— Quelle que soit la base B, elle est représentée par 
B = 10. 

— Le nombre de chiffres (signes numériques) nécessai¬ 
res est égal à B (y compris le 0). Ainsi, dans le système à base 
douze, il faudra douze chiffres (les dix chiffres arabes et, par 
exemple, deux lettres grecques, a et 3 , pour désigner dix et 
onze) ; dans le système de base 5 il en faudrait cinq, etc. 

— On a toujours B 2 = 100, B 3 = 1 000,... 

— Pour passer du système décimal usuel au système de 
base B, on procède comme pour le passage en système 
binaire, en écrivant la série des quotients par B et les restes 
correspondants ; si la base est supérieure à dix, les restes 
pourront être désignés par des signes tels que a, 3, etc. Le 
passage inverse, du système de base B au système décimal, se 
fait selon le même principe que le passage du système binaire 
au système décimal. 

— Exemple : Soit à écrire le nombre (en décimal) 6683 
dans le système duodécimal (B = 12) et dans le système à 
base 7. 

1° Signes du système duodécimal : 0 , 1 , 2 , 3, 4, 5, 6 , 7, 8 , 9, a 
(dix), p (onze). 

Signes du système de base 7 : 0 , 1 , 2, 3, 4, 5, 6 . 

2° Calcul : 


Base B = 12 
(12 = 10, 144 = 100,...) 


6683 11 =3 
556 4 

46 10 = a 

3 3 

0 


Base B = 7 
(7 = 10, 49 = 100, 
343 = 1 000,...) 

6683 5 
954 2 

136 3 
19 5 
2 2 
0 


6683 = 3 a 4 p (en système 6683 = 25325 (avec la 
duodécimal) ; base B = 7). 

— Le calcul inverse est immédiat ; ainsi 25325 (base 7) 
donne : 


136 





Ordres 

5 e 4 e 3 e 2 e 

1 er 

unités 

simples 

Nombre 




d’unités 

2 5 3 

2 

. 5 

Équivalent 




décimal 

2 x 7 4 5 x 7 3 3 x 7 2 

2x7 

5 


Donc : 25325 (base 7) = 2x7 4 + 5x7 3 + 3x7 2 -f 2x7 + 5 = 

= 4802 + 1715 + 147 + 14 + 5 = 6683. 


Calcul sur les nombres entiers. 

Les quatre opérations (addition, soustraction, multiplication, 
division) se font à partir de tables qui indiquent les résultats de 
ces opérations pour toute composition des nombres x infé¬ 
rieurs à la base du système. Dorénavant, nous ferons tous les 
calculs dans le système décimal (c’est-à-dire que nous renon¬ 
cerons à transcrire les nombres dans un système tel que le 
système binaire ou le système duodécimal) ; il ne sera plus 
nécessaire d’utiliser des caractères gras pour la numération 
décimale et des caractères maigres pour les autres types de 
numération (qui seront, éventuellement, précisés). 

• Les quatre opérations sur les nombres entiers. 

Quand on sait calculer les sommes, les différences, les 
produits et les quotients des nombres 1, 2, 3, 4, 5, 6, 7, 8, 9 
associés deux à deux, on peut faire toutes les opérations sur 
n’importe quel autre nombre, aussi grand soit-il. Les procédés 
de calcul sont enseignés dans les classes élémentaires et 
peuvent être utilisés par des machines à calculer. Ces procé¬ 
dés ne sont pas les seuls possibles. Voici, à titre de curiosité, la 
méthode ancienne pour poser les multiplications, dite 
méthode per gelosia. On a pris comme exemple la multiplica¬ 
tion de 5789 par 361. 



2 0 8 9 


On inscrit le multiplicande de gauche à droite et le multipli¬ 
cateur de bas en haut sur les côtés d’un rectangle. Dans 
chaque case, divisée en deux par une diagonale, on inscrit le 
résultat du produit des deux nombres écrits en tête de la ligne 
et de la colonne auxquelles appartient la case ; le chiffre des 
dizaines de ce produit est écrit à gauche de la diagonale, le 
chiffre des unités à droite. On fait ensuite la somme des 
nombres dans les bandes diagonales, en reportant les retenues 
d’une bande sur l’autre, en commençant par la bande du haut. 
On lit le résultat de la multiplication « autour » du rectangle, en 
partant de l’angle inférieur gauche et en remontant jusqu’à 
l’angle supérieur droit : 2089829. (Vérifier, en faisant la multi¬ 
plication selon le procédé classique.) 

• Unités fractionnaires. 

Nous étudierons plus loin les règles de calcul sur les 
fractions ; on sait que le système décimal permet d’exprimer 
n’importe quelle fraction en dixièmes, centièmes, millièmes, 
etc. Ces unités sont dix fois, cent fois, mille fois,... plus petites 
que les unités simples. On les distingue de celles-ci en les 
écrivant à leur droite et en les séparant par un signe conven¬ 
tionnel : la virgule, « , » ou, dans les pays anglo-saxons, le 
point « . ». Dans un système de base B, on pourrait adopter le 
même principe, les unités fractionnaires étant alors B fois, 
B x B fois, B x B x B fois,... plus petites que les unités 
simples. 

Pour multiplier un nombre par 10, 100, 1 000, .... 10", on 
inscrit à sa droite un, deux, trois, ... n zéros s’il s’agit d’un 
nombre entier, ou bien on déplace la virgule de 1 , 2 ,... n rangs 
vers la droite s’il s’agit d’un nombre à partie fractionnaire. 
Inversement, pour diviser un nombre par 10", on enlève n zéros 
(s’ils existent) à ce nombre s’il est entier, ou bien on déplace la 
virgule de n rangs vers la gauche. 

Ainsi, un nombre, avec sa partie entière et sa partie fraction¬ 
naire (décimale s’il s’agit du système usuel à base 10 ), devient, 
dès qu’il est écrit, un symbole relatif, sur lequel les calculs 
deviennent mécaniques. 

• Extraction des racines carrées. 

Voici, sans démonstration, le procédé de calcul, appliqué à 
l’exemple 

x = VI63,689. 


— On partage le nombre donné en tranches de deux 
chiffres à partir de la virgule, vers la gauche et vers la droite ; la 
première tranche à gauche peut n’avoir qu’un chiffre, la 
dernière tranche à droite peut être complétée par un zéro : 

11631,68190 . 

— On extrait la racine entière de la première tranche, 
c’est-à-dire le plus grand nombre dont le carré est inférieur ou 
égal au nombre que représente la première tranche. Ici, la 
première tranche est 1, la racine carrée de 1 est 1 (1 x 1 = 1). 


Ce résultat, 1, est le premier chiffre de la racine x cherchée ; on 
l’inscrit en face du nombre donné, et on écrit, sous la première 
tranche, la différence entre cette première tranche et le 
nombre trouvé (ici : 1-1=0): 

11631,68190 1 

0 


— On abaisse la tranche suivante (63) et on sépare un 
chiffre à droite du nombre ainsi formé ; on double le chiffre 1 
trouvé à la racine et on inscrit ce « double » sous la racine : 

116 31,68190 1 
0 613 2 


— On divise la tranche 06 par 2 (le nombre qui a été 
inscrit sous le 1), et l’on inscrit le quotient, 3, à droite de 2 ; on 
fait ensuite le produit 23 x 3 = 69 ; ce produit est supérieur à 
63, il ne convient pas, car on ne peut pas le soustraire de 63. On 
essaie alors le chiffre immédiatement inférieur à 3, soit 2 ; le 
produit 22 x 2 = 44 est inférieur à 63 : le chiffre 2 convient : 


116 31,68190 
0 613 


1 

23 x 3 = 69 


1|6 31,68190 
0 613 


J 

22 x 2 = 44 


(63-69 impossible) 


(63-44 = 19) 


— On soustrait 44 de 063 ; on trouve 19 ; le chiffre 2 est 
le deuxième chiffre de la racine ; on l’inscrit à droite du 1 ; 19 
est écrit sous 63 et l’on abaisse à côté de 19 la tranche 
suivante, 68. Comme cette tranche est décimale, on met une 
virgule à la racine, après le 2 : 

116 31,68190 12, 

0 613 22 x 2 = 44 

1 9 68 


— On sépare un chiffre à droite de 1968, on double le 
nombre trouvé à la racine, soit 24, et on divise 196 (obtenu en 
séparant un chiffre à droite de 1968) par 24, ce qui donne, 
comme quotient, 8. On essaie 8 comme au 4°, en écrivant 8 à la 
droite de 24, ce qui donne 248, et en effectuant 248 x 8 = 1984 ; 
1984 est supérieur à 1968, donc 8 ne convient pas, et il faut 
essayer 7, qui convient (247x7 = 1729), et qui est donc le 
troisième chiffre de la racine : 


116 31,6 8|90 

12, 

116 31,6 8|90 

12,7 

0 613 

22 x 2 = 44 

0 613 

22 x 2 = 44 

1 9 618 

24 

1 9 618 

247x7= 1729 



2 3 9 



(1968-1729 = 239) 

— On abaisse la tranche 90 ; on sépare un chiffre à 
droite ; on double 127, ce qui fait 254 (on ne tient pas compte 
de la virgule pour ces calculs intermédiaires) ; on divise 23990 
par 254 ; on trouve 9, chiffre qu’on essaie (2549 x 9 = 22941, 
inférieur à 23990 ; donc 9 convient) ; 9 est le quatrième chiffre 
de la racine. 

116 31,6 819 0 12,79 _ 

0 6|3 22x2 = 44 

1 9 618 247X7 = 1729 

2 3 9 910 2549x9 = 22941 

10 4 9 


Résultat : la racine carrée de 163,689 est 12,79 ; le reste est 
0,1049. 

Vérification : (12,79 ) 2 = 12,79 x 12,79 = 163,5841, et 

163,689 - 163,5841 = 0,1049. 

Si l’on voulait pousser plus loin le calcul, on abaisserait une 
tranche 00 à la droite de 1049, qui est le dernier reste partiel, et 
l’on continuerait de la même façon. 

• Opérations en système binaire. 

La table d’addition se réduit à : 

0 +- 0 = 0 ; 1 + 0 = 1 ; 1+1 = 10 ; 
et la table de multiplication à : 

0 x 0 = 0 ; 0 x 1 = 0 ; 1 x 1 = 1 . 

Soit à additionner les deux nombres (binaires) 100101110 et 
111011 ; on écrira : 

11111 

100101110 

111011 

101101001 

Voici les étapes du calcul (en partant de la droite) : 0 et 1 font 1, 
je pose 1 ; 1 et 1 font 10 , je pose 0 et je retiens 1 ; 1 et 0 font 1 , et 
1 de retenue font 10 , je pose 0 et je retiens 1 ; 1 et 1 font 10 , et 1 
de retenue font 11 , je pose 1 et je retiens 1 ; 1 et 0 font 1 , et 1 de 
retenue font 10 , je pose 0 et je retiens 1 ; 1 et 1 font 10 , et 1 de 
retenue font 11 , je pose 1 et je retiens 1 ; 0 et 1 de retenue font 
1 , je pose 1 ; 0 n’est ajouté à aucune retenue, je pose donc 0 ; 
de même je pose 1 (les retenues ont été inscrites en petits 
caractères). 

La multiplication est tout aussi simple (voir exemple ci-des¬ 
sous). 


1011 
x 11 
1011 
1011 
100001 

• Preuves des opérations. 

Soit deux nombres x et y, exprimés dans un système de 


ARITHMÉTIQUE ÉLÉMENTAIRE 

base B. Appelons x et ÿ les congruences modulo a qui 
admettent respectivement x et y pour représentants. On établit 
les égalités : 

x + y = (x + y) et x.y = (xy). 

Supposons que nous puissions déterminer facilement le reste 
de la division d’un nombre x par a ; faire la preuve par a 
consiste à vérifier des égalités de congruences. Par exemple, si 
nous avons calculé le produit 131 x 72 et trouvé 9432, la preuve 

par a_ de_cette opération consiste à vérifier que 

131 x 72 = 9432. 

On utilise la propriété suivante, liée aux systèmes de numé¬ 
ration : si un nombre x est écrit dans un système de base B, le 
reste de la division de x par (B - 1) est le même que le reste de 
la division de la somme de ses chiffres par (B - 1). Il est donc 
immédiat de calculer les congruences modulo (B- 1) et de 
faire, par conséquent, la preuve par (B - 1)_des opérations. On 
dispose généralement les congruences x, y, etc. dans les 
quatre angles d’une croix : 



Preuve de l’addition x + y : Preuve de la multiplication xy : 
On calcule les congruences on vérifie que 
37 et ÿ", et on v érifie q ue 37. ÿ= (xÿ) 

x+y =(x + y). 



Preuve de la division de x par y (quotient : q ; reste : r) : on 
vérifie que qÿ~+ 7= 37 

Dans le système décimal (B = 10), on fait la preuve par 
B - 1 =9. Par exemple, pour le produit 131 x 72 = 9432, on a : 

Reste de la division par 9 de J_31 = reste de la djvision par 9 
de (1 +3 + 1 ) = 5, c’es t-à-di re : 131 = (1 + 3 + 1 ) = 5 ; de même 
72 = (7 + 2)_= 0 et 9432 = 0. On a donc d’une part: 
13Ï x 72 = 5x0 = 0 et, d’autre part, 

9432 = (131 x 72) = 0 :Ô = Ô, 

donc la multiplication a des chances d’être exacte. (Cette 
« preuve » ne donne pas une garantie certaine de l’exactitude 
du résultat trouvé, car un résultat comme 94329, par exemple, 
donnerait aussi une congruence égale à 0, puisque 94329 
diffère de 9432 par le chiffre 9, qui n’influe pas sur le reste de la 
division par 9 de la somme des chiffres.) 


PGCD et PPCM ; caractères de divisibilité. 

(Voir aussi p. 25.) 

• Rappel. 

Un entier naturel différent de 1 qui n’admet pour diviseurs 
que lui-même et l’unité est appelé un nombre premier. Deux ou 
plusieurs nombres sont dits premiers entre eux lorsqu’ils 
n’admettent que l’unité comme diviseur (entier) commun. 

— Théorème de Bézout : Deux entiers positifs a et b 
sont premiers entre eux si, et seulement si, il existe deux 
entiers positifs u et v tels que au-bv = 1. 

— Conséquence : si a est premier avec b et avec c, il est 
premier avec le produit bc. 

— Théorème de Gauss : Si a et b sont deux nombres 
premiers entre eux et si a divise le produit bc, alors a divise c. 

— Conséquence : si a est divisible séparément par deux 
entiers b et c premiers entre eux, alors il est divisible par le 
produit bc. 

— Théorème : Tout nombre entier est décomposable en 
un produit de facteurs premiers, et cela d’une façon unique. 

• Méthode pratique de décomposition d’un nombre en 
facteurs premiers. 

— On écrit le nombre à décomposer en haut d’une 
colonne et on le divise par le premier des nombres premiers, 2 ; 
si cette division peut se faire sans reste, c’est-à-dire si le 
nombre donné est divisible par 2, on inscrit le quotient en 
dessous du nombre donné et le facteur 2 en face de ce nombre. 

— Si le quotient obtenu est divisible par 2, on inscrit à 
nouveau 2 en face du quotient, et le deuxième quotient en 
dessous du premier. On continue ainsi jusqu’à ce qu’on ait 
épuisé toutes les divisions par 2 possibles. On passe ensuite la 
division du dernier quotient obtenu par 3, puis par 5, 7,... en 
suivant l’ordre des nombres premiers. Quand la division n’est 
pas possible exactement, on passe au facteur suivant. La 
décomposition est terminée lorsque le dernier quotient obtenu 


— Exemple. Soit à décomposer en 
facteurs premiers le nombre 4 776 408. Il 
est divisible par 2, ce qui donne le quotient 
q, = 2 388 204 ; q : est divisible par 2, ce qui 
donne q 2 = 1 194 102 ; q 2 est divisible par 
2, ce qui donne q 3 = 597 051 ; q 3 n’est pas 
divisible par 2, ce qui met un terme aux 
divisions par 2 ; on passe alors aux divi¬ 
sions par 3. 

597 051 est divisible par 3 (voir ci-après, p. 138) et donne 
comme quotient q 4 = 199017; q 4 est aussi divisible par 3, 
ce qui donne q 5 = 66 339 ; q 5 est divisible par 3 et donne le 
quotient q G = 22113, qui est encore divisible par 3 et donne 
d 7 = 7 371 ; on continue ainsi jusqu’à q^^ =91, qui n’est plus 
divisible par 3. 


4 776 408 2 
2 388 204 2 
1 194 102 2 
597 051 
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4 776 408 
2 388 204 
1 194 102 
597 051 
199 017 
66 339 
22 113 
7 371 
2 457 
819 
273 
91 
13 
1 


2 

2 

2 

3 

3 

3 

3 

3 

3 

3 

3 

7 

13 


Pour q u , on cherche les nombres 
premiers supérieurs à 3 susceptibles 
de le diviser exactement ; 5 ne convient 
pas, mais 7 donne comme quotient 
q 12 = 13, qui, lui-même, est premier, 
n’admettant que g 13 = 13 et 1 comme 
diviseurs. 

Finalement, on a : 

4776408 = 2x2x2x3x3x3x 
X3x3x3x3x3x7x13 

= 2 3 x 3 8 x 7x 13. 


• Calcul du PGCD de deux ou plusieurs nombres. 

Règle : On décompose les nombres en question en facteurs 
premiers et on forme le produit de tous les facteurs premiers 
communs aux diverses décompositions, affectés de leur plus 
petit exposant. 

Exemple : PGCD des nombres 103 194, 8 316 et 5 544. On 
décompose les trois nombres en facteurs premiers selon la 
méthode exposée plus haut : 


103 194 

2 

8 316 

2 

5 544 

51 597 

3 

4 158 

2 

2 772 

17 199 

3 

2 079 

3 

1 386 

5 733 

3 

693 

3 

693 

1 911 

3 

231 

3 

231 

637 

7 

77 

7 

77 

91 

7 

11 

11 

11 

13 

1 

13 

1 


1 


103 1 94 = 2 x 3 4 x 7 2 x 13 ; 8 316 = 2 2 x 3 3 x 7 x 11 ; 

5 544 = 2 3 x 3 2 x 7 x 1 1. 

Les facteurs communs, affectés de leur plus petit exposant, 
sont 2, 3 2 et 7, donc : 

PGCD = 2 x 3 2 x 7 = 126. 

• Calcul du PPCM de deux ou plusieurs nombres. 
Règle : On décompose les nombres en facteurs premiers et 

on forme le produit de tous les facteurs premiers différents, 
communs ou non, qui figurent dans les décompositions, 
chaque facteur étant affecté de son plus grand exposant. 

Exemple : le PPCM de‘103 194, 8 316 et 5 544 (mêmes 
nombres que ci-dessus) est 

PPCM = 2 3 x 3 4 x 7 2 x 11 x 13 = 4 540 536 . 

• Caractères de divisibilité. 


même nombre, diviseur commun du numérateur et du dénomi¬ 
nateur ; lorsque ces divisions ne sont plus possibles, la fraction 
est dite irréductible. Deux méthodes peuvent être utilisées. 

— Les diviseurs communs sont apparents (on les 
découvre en appliquant les caractères de divisibilité aux deux 
termes de la fraction) : la simplification est immédiate. 

— Les diviseurs communs ne sont pas apparents : on 
cherche le PGCD des deux termes de la fraction et on les divise 
par ce PGCD. La fraction obtenue est irréductible. 

Dans ce qui suit, nous supposerons que les fractions dont on 
part sont irréductibles. 

• Réduction au même dénominateur. 

— Méthode directe : Pour réduire plusieurs fractions au 
même dénominateur, D, on multiplie entre eux tous les 
dénominateurs, et on multiplie chaque numérateur par le 
produit des dénominateurs des autres fractions. 

Exemple : soit à réduire au même dénominateur les fractions 
3/4, 5/9, 1/6, 7/13. On a : 

D = 4x9x6x13 = 2808 
et : 

3 _ 3 x 9 x 6 x 13 _ 2106 
4~ D ~ 2808 ’ 

5 5x4x6 x 13 1560 

9 “ D ~ 2808 ’ etC ‘ 

— Méthode du PPCM : On décompose chaque dénomi¬ 
nateur en facteurs premiers et on calcule le PPCM de ces 
dénominateurs, ce qui donne le dénominateur commun cher¬ 
ché. On multiplie ensuite chaque numérateur par les facteurs 
du dénominateur commun qui ne figurent pas dans le dénomi¬ 
nateur correspondant. 

Exemple : Reprenons les quatre fractions considérées 
ci-dessus. 

PPCM de 4 , 9, 6, 13 = 2 2 x 3 2 x 13 , 

3 _ 3 x 3 2 x 13 351 5 5 x 2 2 x 13 260 

4~ 468 ~ 468 ’ 9 “ 468 " 468 ’ GtC ' 

• Opérations sur les fractions. 

— Addition : On simplifie, puis on réduit au même 
dénominateur les fractions à additionner ; on a alors : 

a b a + b 
D + D ~ D 

— Soustraction : même règle opératoire, mais (a + b) 
est remplacé par (a - b). 

— Multiplication : on simplifie les fractions à multiplier, 
puis on fait le produit des numérateurs et celui des dénomina¬ 
teurs : 


Il existe des règles permettant, dans certains cas, de recon¬ 
naître, sans faire la division, si un nombre est divisible par un 
autre ; ces règles s’appellent des caractères de divisibilité. 
Nous ne donnerons que les plus usuelles d’entre elles. 

— Divisibilité par 2 : un nombre est divisible par 2 quand 
il se termine par 0 ou par un chiffre pair. 

— Divisibilité par 4 : un nombre est divisible par 4 quand 
le nombre formé par ses deux derniers chiffres est divisible 
lui-même par 4. 

— Divisibilité par 8 : un nombre est divisible par 8 quand 
le nombre formé par ses trois derniers chiffres est lui-même 
divisible par 8. 

— Divisibilité par 2 n : un nombre est divisible par 2" 
quand le nombre formé par ses n derniers chiffres est 
lui-même divisible par 2 n . 

— Divisibilité par 5 : un nombre est divisible par 5 quand 
il se termine par 0 ou par 5. 

— Divisibilité par 25 : un nombre est divisible par 25 
quand il se termine par 00, 25, 50 ou 75. 

— Divisibilité par 3 : un nombre est divisible par 3 quand 
la somme de ses chiffres est divisible par 3. 

— Divisibilité par 9 : un nombre est divisible par 9 quand 
la somme de ses chiffres est divisible par 9. 

— Divisibilité par 11 : un nombre est divisible par 11 
quand la différence entre la somme de ses chiffres de rangs 
impairs et la somme de ses chiffres de rangs pairs est nulle, ou 
égale à 11, ou à un multiple de 11. 

Fractions et rapports. 

Calcul sur les fractions. 

• Définitions. 

Une fraction est un élément de l’ensemble Z x Z*, la notation 
Z* désignant l’ensemble Z privé du 0. Une fraction se note 

(a, b), ou a/b, ou £ ; a est le numérateur et b le 
b 

dénominateur de la fraction. Nous résumons ci-dessous les 
règles pratiques de calcul sur les fractions. Pour la théorie, voir 
à la p. 31. 

• Comparaison des fractions et des nombres entiers. 

— Une fraction dont les deux termes sont égaux est 

égale à l’unité: par exemple, 3/3 = 1. Si le numérateur est 
supérieur au dénominateur, la fraction est supérieure à l’unité ; 
si le numérateur est inférieur au dénominateur, elle est infé¬ 
rieure à l’unité. 

— Si le numérateur est divisible par le dénominateur, la 
fraction peut être remplacée par un nombre entier : 8/2 = 4. 
Inversement, un nombre entier peut être converti en fraction : 
par exemple, pour convertir le nombre 8 en fraction de 
dénominateur égal à 5, on écrit : 8 = 8 x 5/5. 

• Simplification des fractions. 

Pour simplifier une fraction, on divise ses deux termes par un 


a_ c__ ac 
b X d bd 

— Division : pour diviser une fraction a/b (dividende) 
par une fraction c/d (diviseur), on multiplie la fraction divi¬ 
dende par la fraction diviseur renversée : 

a_ m _Ç__a d_ _ ac/ 
b ‘ d b c bc 

Le calcul sur les fractions n’est compliqué qu’en apparence : 
en fait, tout calcul un peu important se ramène à une série de 
petits calculs élémentaires qu’il suffit de faire avec soin, en 
respectant bien les règles opératoires. La simplification des 
calculs exige une certaine pratique, que donnent les exercices. 

Rapports et proportions. 

• Définitions. 

— On appelle rapport de deux nombres réels a et b le 
quotient q du nombre a par le nombre b, supposé non nul ; ce 
quotient est positif, négatif, ou nul (si a = 0 ), et représenté par 
la notation a/b. 

— Étant donné deux ensembles A et B, formés d’élé¬ 
ments notés a u a 2 , a 3 , ... pour A et b 1t b 2 , b 3 , ... pour B, on dit 
que ces ensembles sont formés de nombres proportionnels si 
le rapport, a,/b lt de deux éléments de même rang appartenant 
respectivement aux deux ensembles A et B est indépendant du 
rang i, c’est-à-dire si 

a i a 2 a 3 a/ 

~b^ = ~b~2 = ~bl = b7 = k ' 

Si les ensembles A et B sont dénombrables et si leurs 
éléments vérifient les égalités précédentes, on dit que A et S 
forment des suites de nombres proportionnels. 

• Propriétés des nombres proportionnels. 

— Théorème : Si deux nombres non nuis, a et a', sont 
proportionnels à deux nombres non nuis, b et b', dans le 
rapport k, l’égalité 



entraîne l’égalité 

xa +ya' k 
xb + yb' 

à la condition que xa + ya' et xb + yb' soient tous deux 
différents de zéro. 

— Application : En faisant successivement x = y= 1, 
puis x = 1 et y = - 1, le théorème précédent permet d’écrire : 

a a' a + a ' a - a ' 

b ~ b’~ b + b' ~ b - b'~ ‘ 


• Proportions. 

— Quatre nombres,»a, b, c, d, pris dans cêt ordre, 
forment une proportion si les deux premiers sont proportion¬ 
nels aux deux derniers, c’est-à-dire si l’on a 

a b_ 
c d ' 


Les termes a et d sont appelés les extrêmes, les termes b et 
c sont les moyens. 

— Théorème fondamental : Quatre nombres non nuis, 
a, b, c, d, pris dans cet ordre, forment une proportion si, et 
seulement si, le produit des extrêmes est égal au produit des 
moyens : 

a b 

— = —<£> ad = bc . 

c d 


— Corollaire : on déduit du théorème précédent qu’on 
peut permuter, dans une proportion, les extrêmes entre eux et 
les moyens entre eux (on a toujours, en effet, ad = bc). 

— Quatrième proportionnelle : Étant donné trois nom¬ 
bres non nuis, a, b, c, on appelle quatrième proportionnelle à 
ces trois nombres, pris dans cet ordre, le nombre x tel que a, 
b, c, x soient en proportion : 


b 


c^ 

x ’ 


d’où 


x 


bc 

a 


— Moyenne proportionnelle : On appelle moyenne pro¬ 
portionnelle à deux nombres non nuis, a et b, un nombre x tel 
que a, x, x, b soient en proportion : 

a x , 2 

— = —, d ou x = ab . 
x b 


Calcul algébrique élémentaire. 

Nous présentons ici un ensemble de règles de calcul et de 
formules, sans donner de justification, et sans référence aux 
armatures logiques expliquées dans le texte (pp. 7 à 73). Les 
nombres sur lesquels on calcule sont supposés réels. 

Nombres relatifs. 

• Interprétation graphique. 

Si l’on choisit, sur un axe, une origine O (figure ci-dessous) 
et si l’on veut préciser la position d’un point M, il faut, non 
seulement donner sa distance à cette origine, mais aussi 
indiquer s’il se trouve à droite ou à gauche de O. Le nombre 
qu’on fait correspondre à la position du point M comprend 
donc deux parties : 

— la mesure, avec une unité quelconque, de la distan¬ 
ce OM ; ce peut être un nombre entier ou fractionnaire, 
rationnel ou irrationnel (voir pour ce dernier cas les pp. 54- 
55); 

— un signe quelconque précisant sa position à gauche 
ou à droite de O. On peut choisir le signe « + » pour les 
mesures à droite de O, et le signe « - » pour les mesures à 
gauche 

Avec ces conventions, la position du point M est désignée 
par (+3) et la position du point M' par (-3). 


1 | 

1 I 1 

, I 


1 1 

M' 

0 

1 J 

M 


(-3 ) 


( 3 ) 



• Description d’un nombre relatif. 

Un nombre relatif comprend deux parties : 

— un nombre arithmétique (entier ou fractionnaire, 
rationnel ou irrationnel) : c’est sa valeur absolue ; 

— un signe « + » (nombre positif) ou « - » (nombre 
négatif). 

Quand on veut désigner uniquement la valeur absolue d’un 
nombre relatif, on l’encadre entre deux barres verticales : 

| — 31 = 3 ou | + 3| = 3 . 

Nous désignerons souvent, par la suite, un nombre relatif par 
une lettre, comme a, b, x, etc. Ne pas oublier que, dans ce cas, 
le symbole « a » comprend une valeur absolue et un signe. 

• Comparaison des nombres relatifs. 

— Tout nombre positif est supérieur à 0 (> 0 : lire « plus 
grand que 0 »). 

— Tout nombre négatif est inférieur à 0 (< 0 : lire « plus 
petit que 0 »). 

— 0 n’est ni positif ni négatif. 

— De deux nombres positifs, le plus grand est celui qui a 
la plus grande valeur absolue. 

— De deux nombres négatifs, le plus grand est celui qui 
a la plus petite valeur absolue (exemple: -4°C est une 
température plus élevée que -22°C). 

— Deux nombres relatifs ayant même valeur absolue 
mais de signes contraires sont dits opposés : + 3 et - 3 sont 
opposés. 

Opérations sur les nombres relatifs. 

• Addition. 

Pour additionner deux nombres relatifs a et b, on applique 
les règles indiquées par le tableau suivant : 
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CALCUL ALGEBRIQUE ELEMENTAIRE 



Résultat 

Cas considéré 

Signe 

Valeur 

absolue 

a et b de même signe 

Le signe 
commun 

Somme des 
deux valeurs 
absolues. 

a et b de signes 
contraires 

Signe de celui 
qui a la plus 
grande valeur 
absolue. 

Différence 
des deux 
valeurs abso¬ 
lues. 


— si a est positif, a" est positif ; 

— si a est négatif, a n est positif si nest pair, et négatif si n 
est impair. 

— Cas particulier important : le carré d’un nombre 
(élévation de ce nombre à la puissance 2) est toujours positif, 
quel que soit ce nombre (2 est pair). 

— Exposants. Lorsqu’on écrit, par exemple, a 4 , le chiffre 
4, écrit (en petits caractères) en haut et à droite de a, s’appelle 
l’ exposant de a. 

— Exposant 0 : par convention, â° = 1, quel que soit a. 

— Exposant 1 : a 1 = a. 

— Exposant négatif : une puissance d’exposant négatif 
est l’inverse de la puissance d’exposant positif opposé au 
précédent. Exemples : 



• Racine n-ième d’un nombre. 


on calculera d’abord le résultat de l’opération écrite entre 
crochets : 

(+ 5) - (+ 2) - (- 7) = 5 - 2 + 7 = + 10 ; 
on sera alors ramené au calcul de : 

(+12) -(+10) + (+3). 

Enfin, dans le cas où les termes d’une somme algébrique 
sont représentés par des lettres, si un groupe de termes est 
écrit entre parenthèses : 

— lorsque l’expression mise entre parenthèses est pré¬ 
cédée du signe « + » on peut supprimer les parenthèses 
purement et simplement ; 

— lorsque l’expression mise entre parenthèses est pré¬ 
cédée du signe « - », on peut supprimer les parenthèses, 
moyennant que l’on remplace par son opposé chacun des 
termes de cette expression. Ainsi : 

a + (b-c+d)-f=a + b- c + d-f\ 
a - \b - c + d) - f = a - b + c - d - f. 

• Expressions algébriques. 


Exemples : (+ 7) + (- 5) = (+ 2), 

(- 5) + (- 8) = (— 13).. 

Pour additionner plusieurs nombres relatifs, on peut ajouter 
le deuxième au premier, puis le troisième au résultat précé¬ 
dent, et ainsi de suite ; on peut intervertir l’ordre des termes. 

• Soustraction. 

Pour retrancher un nombre relatif b d’un autre nombre 
relatif a, on ajoute à a le nombre b changé de signe (c’est-à- 
dire l’opposé b' = - b). Une soustraction se ramène donc à 
une addition : il n’y a pas de « soustraction impossible » en 
algèbre (alors qu’il y en avait en arithmétique élémentaire). 

• Multiplication. 

Le produit de deux nombres relatifs a.et b est un nombre 
relatif p dont la valeur absolue est le produit des valeurs 
absolues de a et b, et dont le signe est donné par la règle des 
signes : 


Signe de a 

Signe de b 

Signe de p 

+ 

+ 

+ 

- 

- 

+ 

+ 

- 

- 

— 

+ 

— 


Le produit de deux nombres a et b peut être représenté par 
la notation a x b, ou a . b, ou simplement ab. 

— Deux nombres de même signe ont un produit positif ; 
deux nombres de signes contraires ont un produit négatif. 

— a = 0 = 0 xa = 0 , quel que soit a. 

— En multipliant un nombre relatif par + 1 on obtient le 
même nombre. 

— En multipliant un nombre relatif par - 1 on obtient le 
nombre opposé. 

— Pour faire le produit de plusieurs nombres, on multi¬ 
plie le premier par le deuxième, puis le résultat obtenu par le 
troisième et ainsi de suite. Pratiquement, on peut aussi faire le 
produit de toutes les valeurs absolues sans se préoccuper des 
signes, puis compter les signes négatifs : le résultat est positif 
si le nombre de signes négatifs est nul ou pair, il est négatif 
dans le cas contraire. 

Exemple : 

(- 3) x (+ 5 ) x (+ 6 ) x (- 12) x (+ 9) x (- 2) = p. 

Produit des valeurs absolues = 19 440. 

Nombre de signes négatifs : 3 (impair). 

Donc p = - 19 440. 

• Division. 

Diviser un nombre relatif a (dividende) par un nombre 
relatif b (diviseur), c’est trouver un troisième nombre relatif c 
qui, multiplié par b, donne a. On obtient c en faisant le quotient 
de la valeur absolue de a par celle de b et en lui donnant un 
signe conformément à la règle des signes, appliquée à a et b. 

— On appelle inverse d’un nombre le quotient de 1 par 
ce nombre ; l’inverse de xest donc 1/x. Pour diviser a par b, on 
peut aussi multiplier a par l’inverse de b: 


La multiplication d’un nombre par son inverse donne 1. 
— La division de a par 0 est impossible (n’a pas de sens). 
— La division de a par 1 donne a. 

— La division d’un nombre par lui-même donne 1. 

— La division d’un nombre par — 1 donne ce nombre 
changé de signe. 

• Puissance n-ième d’un nombre relatif. 

C’est le produit de n facteurs égaux à ce nombre. Par 
exemple : 

(- 3 ) 3 = (- 3 ) x (- 3) x (- 3) = - 27 (ne pas confondre (- 3 ) 3 
avec (- 3) x 3). 

a 4 = axaxaxa (ne pas confondre a 4 avec a x 4). 

— D’après ce que nous avons dit plus haut (procédé 
pratique de multiplication de plusieurs facteurs), on voit que : 


— Racine n-ième arithmétique d’un nombre arithméti¬ 
que. Étant donné un nombre arithmétique A, il existe un 
nombre arithmétique X, et un seul, tel que 

X n = A . 

Ce nombre X s’appelle la racine n-ième arithmétique de A. 
On le désigne par la notation VÂ. L’écriture Wappelle un 
radical ; n est l’ indice de ce radical. 

VÂ s’appelle la racine carrée arithmétique de A ; dansée 
cas, on se dispense, en général, d’écrire l’indice du radical. \TÂ 
s’appelle la racine cubique de A. 

— Produit et quotient de deux racines carrées. On 
démontre les formules suivantes : 

_ _ _ Va fa 

Va x Vb = Va x b et -= / — 

Vb Vb 

— Racine n-ième d’un nombre relatif. On appelle racine 
n-ième d’un nombre relatif a tout nombre relatif x tel que 

x" = a. (1) 

Cas où n = 2 (racine carrée). D’après ce qui précède, on 
appelle racine carrée de a tout nombre x tel que 

x 2 = a . (2) 

On sait que le carré d’un nombre relatif, positif ou négatif, est 
toujours positif ; si donc a est négatif, il n’existe aucun 
nombre x remplissant la condition (2) ; autrement dit, un 
nombre négatif n’a pas de racine carrée (dans le domaine des 
réels). 

Mais considérons un nombre positif, par exemple a = + 9. Il 
existe deux nombres relatifs tels que x 2 = 9 ; ce sont +3 et 

- 3 ; le nombre 9 a donc deux racines carrées opposées. De 
façon analogue, 25 a deux racines carrées opposées : + 5 et 

- 5 ; 1 a deux racines carrées opposées, + 1 et - 1 ; 2 a deux 
racines carrées opposées, +V2 et - V2 (nombres irration¬ 
nels), etc. D’une manière générale, tout nombre relatif positif a 
possède deux racines carrées opposées, + Va et - Va. 

Cas où n = 3 (racine cubique). D’après la définition générale, 
on appelle racine cubique de a tout nombre x tel que 

x 3 = a . (3) 

Si a est positif, x 3 doit être positif. Or, le cube d’un nombre 
(produit d’un nombre impair de facteurs égaux à ce nombre) et 
ce nombre lui-même sont de même signe ; donc x doit être 
positif. Le nombre a possède alors une racine cubique et une 
seule, qui est positive. 

Si a est négatif, x 3 doit être négatif, donc x doit être négatif. 
Le nombre a possède alors une racine cubique et une seule, 
qui est négative. 

Finalement, un nombre relatif a admet, quel que soit son 
signe, une racine cubique et une seule, qui est de même signe 
que lui. 

Généralités sur le calcul algébrique. 

Parenthèses. 

Nous avons isolé les nombres relatifs dans des parenthèses, 
en écrivant, par exemple, (+7), (-5), etc. 

Lorsqu’on a à calculer une somme de nombres relatifs écrits 
de cette façon, on peut se débarrasser des parenthèses de la 
façon qu’indique l’exemple suivant : 
au lieu de : 

(+ 12) + (- 5) + (+ 3), 
on écrit simplement : 

12-5 + 3, 

en omettant, devant le premier terme, le signe + si (comme 
c’est le cas dans l’exemple ci-dessus) ce terme est positif. 

S’il s’agit d’une suite d’additions et de soustractions (on a 
alors à calculer ce qu’on appelle une somme algébrique), on 
peut, de même, se débarrasser des parenthèses, en changeant 
le signe de chaque terme précédé du signe « - ». Ainsi, au lieu 
de 

(+ 12) — (— 5) + (+ 3) — (+ 2), 

on écrira 

12 + 5 + 3-2. 

Il arrive que, dans l’écriture d’une somme algébrique, un 
groupe de termes consécutifs soit écrit entre parenthèses (ou 
entre crochets) ; cela indique que la somme algébrique par¬ 
tielle de ces termes doit être remplacée par son résultat. 

Ainsi, ayant à calculer 

(+ 12) — [(+ 5) — (+ 2) — (— 7)] + (+ 3), 


Une expression algébrique est un ensemble de lettres (repré¬ 
sentant des nombres relatifs) et de nombres relatifs, sur 
lesquels il faut pratiquer certaines opérationslndiquées par les 
symboles opératoires. 

Une expression algébrique est dite : 

— entière, s’il n’y figure aucune lettre en dénomina¬ 
teur ; 

— rationnelle, s’il n’y figure aucune lettre sous un 
radical ; 

— fractionnaire, s’il y figure une ou plusieurs lettres en 
dénominateur ; 

— irrationnelle, s’il y figure une ou plusieurs lettres 
sous un radical. 

Par exemple : 

2ax 

--— est une expression entière ; 

5 

— 3 x V5 est une expression rationnelle, car, s’il figure 
un nombre sous un radical, on n’y trouve aucune lettre placée 
sous un radical ; 

3 ax - 5 , 

--—-— est une expression fractionnaire ; 


— 3 Vx est une expression irrationnelle. 

On appelle valeur numérique d’une expression algébrique 
pour des valeurs données des lettres qui y figurent le nombre 
que l’on obtient en y remplaçant ces lettres par les valeurs 
données et en effectuant les calculs indiqués. 

2 ax 

Par exemple, la valeur numérique de l’expression —— 

5 

pour a = - 3 et x = 10 est : 


2 x ( - 3) x 10 


— Monômes. On appelle monôme une expression 
entière dans laquelle les seules opérations portant sur des 
lettres sont des multiplications ou des élévations à une puis¬ 
sance. Exemples : 3 ax 2 , 2/3 abx 3 sont des monômes. Le 
facteur numérique s’appelle le coefficient du monôme, les 
lettres constituent sa partie littérale. 

— Deux monômes qui ont la même partie littérale sont 
dits semblables. Le degréd’un monôme par rapport à l’une des 
lettres qui y figurent est l’exposant de cette lettre : par exemple 
3 ax 2 est du premier degré en a (exposant 1, non écrit) et du 
deuxième degré en x (exposant 2). Le degré d’un monôme par 
rapport à l’ensemble de ses lettres est la somme de tous ces 
degrés particuliers ; ici, 3 ax 2 est du troisième degré par 
rapport à l’ensemble de ses lettres. 

— Opérations sur les monômes. 

Addition. — Si les monômes sont semblables, on additionne 
les coefficients et l’on conserve la partie littérale. Exemple : 
3 ax+ 5 ax = 8 ax. Si les monômes ne sont pas semblables, on 
les écrit à la suite les uns des autres en les faisant précéder du 
signe « + » : l’expression devient un polynôme. 

Multiplication d’un monôme par un monôme. — On multiplie 
entre eux les coefficients et entre elles les parties littérales. Ce 
calcul exige que l’on connaisse les règles du calcul des 
puissances (voir ci-dessous). On aura, par exemple : 

- 3 ax 2 y 5 z x 5 axz 3 = - 15 a 2 x 3 y 5 z 4 . 


• Calcul sur les puissances. 

Dans ce qui suit, a désigne un nombre relatif quelconque,les 
exposants m et n sont des nombres entiers qui peuvent être 
positifs, négatifs ou nuis (le cas d’exposants fractionnaires est 
étudié ci-dessous, au n°4). 

Cela posé, voici quelles sont les règles fondamentales du 
calcul des puissances : 

a m x a" = a m ~ ; (a m ) n = a mn ; a m : a n = a m n . 

Exemples d’application de ces règles : 


axa = a 



^ou : a 


1 




• Exposants fractionnaires. 

— Convention. Va peut s’écrire a 1/n ; 1/n est un expo¬ 
sant fractionnaire. 
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POLYNOMES ET FRACTIONS RATIONNELLES 


Avec cette convention d’écriture, a m/n désigne la racine 
n-ième de a m . 

Polynômes. 

• Définitions. 

Un polynôme algébrique est une expression rationnelle 
constituée par une somme algébrique de monômes. 

Exemples de polynômes : 

3 x + 1 ; 3 x 2 - 5 x — 2 ; 4ax 3 -2 bxy +cz-2x 4 z; ... 

La valeur numérique d’un polynôme pour des valeurs don¬ 
nées des lettres qui y figurent est le nombre que l’on obtient 
quand on remplace ces lettres par les valeurs données. 

— Réduction des termes semblables. On appelle ainsi le 
fait de remplacer tous les monômes semblables par leur 
somme effectuée. Par exemple : 

. 2 abx 3 - 3 b 2 y + 5az - 7 abx 3 + 2 b 2 y = - 5 abx 3 - b 2 y+ 5 az. 

— Degré d’un polynôme : c’est le degré du monôme qui 
a le plus haut degré (après réduction). Par exemple, le 
polynôme précédent est de degré 3 par rapport à x (le 
monôme de plus haut degré par rapport à x est - 5 abx 3 ), de 
degré 2 par rapport à b, etc. 

— Polynôme homogène : polynôme dont tous les ter¬ 
mes sont du même degré par rapport à l’ensemble des lettres 
qui y figurent. Exemple : 

a 3 + 3 a 2 b + 3 ab 2 + b 3 

(chaque terme est du degré 3 par rapport à l’ensemble des 
lettres qui y figurent). 

— Polynôme ordonné par rapporté une lettre : c’est un 
polynôme préalablement réduit et dont les termes sont écrits 
par ordre des puissances décroissantes ou croissantes de la 
lettre choisie. Par exemple, le polynôme 

P = 2 a 3 x - 5 bx 5 + 4 abx 2 - 7 x 4 - abc 
peut aussi s’écrire, en l’ordonnant par rapport à x : 

P = - 5 bx 5 - 7 x 4 + 4 abx 2 + 2 a 3 x - abc . 

Bien entendu, on aurait pu tout aussi bien ordonner P par 
rapport aux puissances croissantes de x (le premier terme 
serait alors - abc, le second, 2 a 3 x, etc.), ou par rapport aux 
puissances décroissantes de a ; etc. 

— On est souvent amené à considérer, en algèbre 
élémentaire, des polynômes de la forme : 

A = ax 4 + bx 3 + ex 2 + dx + e . 

(nous avons pris ici un exemple du quatrième degré en x, mais 
on aurait pu prendre A de n’importe quel degré en x). Dans ces 
polynômes, les lettres a, b, c, ... sont les coefficients des 
diverses puissances de la variable x ; le terme « e » est le terme 
constant. Ces dénominations proviennent du fait que dans des 
expressions telles que A, les coefficients a, b, c, ... désignent 
souvent des grandeurs invariables pour un polynôme donné, 
alors que x désigne une quantité essentiellement variable. 

Il est commode, pour un polynôme de degré n, de renoncer à 
appeler les coefficients a, b, c, ..., mais d’utiliser des indices, 
c’est-à-dire des nombres écrits (en petits caractères) en bas et 
à droite d’une lettre, comme par exemple : a,, qui doit se lire 
« a indice 1 », ou — s’il n’y a pas de confusion possible avec un 
exposant — « a un ». Un polynôme à une seule variable x, et de 
degré n, s’écrit alors de la façon suivante : 

a 0 x" + a, x" _1 + a 2 x n 2 + a 3 x" -3 + a 4 x"~ 4 + —i- a n _, x + a n . 

• Addition et soustraction des polynômes. 

— Pour additionner deux polynômes A et B, il suffit de 
les écrire à la suite l’un de l’autre et de réduire le nouveau 
polynôme obtenu, A + B. 

— Pour soustraire un polynôme B d’un polynôme A, il 
suffit d’écrire, à la suite des termes du polynôme A, tous les 
termes du polynôme B changés de signe et de réduire le 
polynôme obtenu, A - B. 

Exemples : 

A = 3ax 3 -5bx 2 + 4ax-7; 

B = ax 3 + 2 bx 2 - 3 bx + 5 ; 

A 4 -B = 4 ax 3 - 3 bx 2 + 4 ax - 3 bx - 2; 

A - B = 2 ax 3 - 7 bx 2 + 4 ax + 3 bx -12. 

(En disposant les polynômes à additionner l’un au-dessous 
de l’autre, les termes semblables étant sur une même colonne, 
les calculs sont immédiats.) 

• Multiplication des polynômes. 

— Produit d’un polynôme par un nombre relatif. La 
règle: a(B + C) = aB + aC s’applique d’une manière géné¬ 
rale ; on a ainsi (le polynôme A étant le même que plus haut) : 

kA = k(3 ax 3 - 5 bx 2 + 4 ax - 7) 

= 3 akx 3 - 5 bkx 2 + 4 akx - 7 k . 

— Produit d’un polynôme par un monôme. On multiplie 
tous les termes du polynôme par le monôme donné et l’on 
ajoute les résultats. Exemple : 

2 abx(3 ax 3 - 5 bx 2 + 4 ax - 7) = 

^ 6 a 2 bx 4 - 10 ab 2 x 3 + 8 a 2 bx 2 - 14 abx. 

(Quand on multiplie un monôme par un monôme, on a 
intérêt à faire d’abord le produit des coefficients numériques et 
à en écrire le résultat avec le signe du produit ; on écrit ensuite 
les lettres l’une après l’autre, dans l’ordre alphabétique, en 
appliquant les règles du calcul sur les puissances.) 

— Produit d’un polynôme par un polynôme. Soit à faire 
le produit PQ, P et O désignant les deux polynômes suivants : 

P = 5 bx 2 + 4 ax - 7, Q = 2 ax 2 - 3 bx + 5 . 


On multiplie chaque terme du polynôme P par le premier 
terme de Q, puis chaque terme de P par le second terme de Q, 
et ainsi de suite ; on ajoute ensuite les résultats, on réduit les 
termes semblables et l’on ordonne, le cas échéant. Quand les 
polynômes sont à une seule variable (comme c’est le cas ici) on 
peut disposer l’opération comme une multiplication banale, en 
plaçant les uns en dessous des autres les termes de même 
degré en x et en laissant éventuellement un vide pour les 
degrés manquants : 

P : 5 bx 2 + 4 ax -7 

Q : 2 ax 2 -3 bx +5 

P x 2 ax 2 : 10 abx 4 + 8 a 2 x 3 -14ax 2 

P x ( - 3 bx ) : - 15 b 2 x 3 -12 abx 2 + 21 bx 

P x 5 : + 25 bx 2 + 20 ax - 35 

Par addition des trois produits partiels, on obtient, sous 
forme de polynôme ordonné suivant les puissances décrois¬ 
santes de x : 

PO = 10 abx 4 + 8 a 2 x 3 - 15 b 2 x 3 - 14 ax 2 - 12 abx 2 + 

+ 25 bx 2 + 21 bx + 20 ax - 35 . 

S’il y avait eu, dans les trois produits partiels, des monômes 
semblables, nous en aurions fait la réduction ; mais tel n’était 
pas le cas, d’où la longueur de l’écriture du produit PO. 

— Une application importante du produit de deux poly¬ 
nômes concerne les identités remarquables. On appelle iden¬ 
tité une égalité entre deux expressions littérales qui est vraie 
quelles que soient les valeurs qu’on donne aux lettres qui y 
figurent (cette définition est très restreinte ici ; pour une 
définition plus générale, se reporter au texte). 

Appliquons les règles de la multiplication des polynômes au 
produit (a + b) (a + b), qui peut s’écrire aussi (a + b) 2 , puisque 
les deux expressions entre parenthèses sont les mêmes. En 
posant la multiplication comme ci-dessus, on a : 

a + b 
a + b 

a 2 + ab 

ab + b 2 

a 2 + 2 ab + b 2 , 

d’où l égalité 

(a + b ) 2 = a 2 + 2 ab + b 2 , 

qui est vraie pour tout couple de valeurs a et b : c’est une 
identité remarquable. 

Voici quelques autres identités remarquables couramment 
utilisées en algèbre élémentaire : 

(a - b) 2 = a 2 - 2 ab + b 2 ; 

(a - b ) (a + b) = a 2 -b 2 ; 

(a + b ) 3 = a 3 + 3a 2 b + 3ab 2 + b 3 ; 

(a - b ) 3 = a 3 -3a 2 b + 3ab 2 -b 3 ; 
a 3 + b 3 = (a +b)(a 2 -ab +b 2 ); 
a 3 - b 3 = (a -b)(a 2 + ab +b 2 ). 


• Mise en facteur. 

Les expressions que l’on traite en algèbre élémentaire ne 
sont pas « anarchiques » comme dans nos exemples : les 
parties littérales de polynômes ne comprennent alors que deux 
ou trois lettres, souvent une seule variable, et il est fréquent 
que des termes de même degré soient semblables (du moins 
dans les applications simples). De toute façon, on cherche 
toujours, en mathématiques, à obtenir l’expression la plus 
simple et la plus commode en vue de calculs ultérieurs ; pour 
cela, on fait subir systématiquement aux expressions certaines 
transformations, comme la réduction des termes, l’ordonnan¬ 
cement, etc. L’une de ces pratiques est très importante : il 
s’agit de la mise en facteur. 

— Exemple numérique. S’il existe, dans une série de 
produits à ajouter ou à retrancher, des produits qui présentent 
un même facteur, ce facteur est dit facteur commun -, par 
exemple, dans l’expression 

(3x 11) + (6x5) -(3x7), 

on constate que le facteur 3 est présent dans les trois produits, 
soit explicitement (1 er et 3 e produits), soit implicitement (2 e 
produit : 6 = 3x2, d’où 6x5 = 3x2x5). 

Pour effectuer la mise en facteur commun du facteur 3, on 
procède ainsi : 

— on écrit 3 isolément ; 

— on le multiplie par une parenthèse dans laquelle sont 
écrits les facteurs restants de chaque produit, précédés du 
signe « + » ou du signe « - » selon le signe du produit en 
question. 

Ainsi, dans notre exemple, le facteur 3 sera suivi d’une 
parenthèse qui comprendra : 

11 précédé du signe « + » ( 1 er produit); 

10 précédé du signe « + »: 3 est en effet un facteur du 
produit 3 x 2 x 5 ; lorsqu’on l’a isolé, il ne reste plus, de ce 
produit, que 2x5 = 10 ; 

7 précédé du signe « - » (3 e produit). 

D’où l’égalité suivante : 

(3 x 11) + (6 x 5) - (3 x 7) = 3 (11 + 10 - 7) 

= 3 x 14 = 42. 

— Cas d’un polynôme. Le problème est plus ou moins 
simple, selon la nature du polynôme. Nous résumons dans ce 
qui suit les cas les plus courants qui peuvent se présenter. 

— Le facteur commun est un monôme : ce cas est très 
voisin de l’exemple numérique précédent ; en voici un exem¬ 
ple : le polynôme 

P = 3 a 2 x 4 - 5 abx 3 + 7 a 3 bx 2 + 6 ab 

est composé de quatre monômes qui contiennent chacun le 
facteur a (il y a bien des monômes dans lesquels ce facteur est 


au degré 2 ou 3, mais alors il n’est plus commun aux deuxième 
et troisième termes, dans lesquels il ne figure qu’à la puissance 
1). On peut isoler ce facteur comme on l’a fait plus haut pour 3 ; 
les monômes restants, qu’on écrira entre parenthèses, seront 
obtenus en divisant les monômes de P par a, conformément 
aux règles de calcul sur les puissances ; d’où : 

P = a(3 ax 4 - 5 bx 3 + 7 a 2 bx 2 + 6 b). 

Bien entendu, nous avons pris un exemple extrêmement 
simple ; le monôme facteur commun peut être plus 
« compliqué » que « a » ; par exemple les deux monômes 

4a 4 yx 5 y 2 16a 2 y 4 x 3 y 
5 6t 35 

ont en commun le facteur 4 a J x Y 
5 

Il est fréquent de rencontrer des polynômes dont la forme se 
prête à l’application d’une identité remarquable. Ainsi, consi¬ 
dérons par exemple le polynôme suivant : 

P = 9 a 2 b 2 - 25 x 2 y 6 . 

Le lecteur constatera sans peine que 9 a 2 b 2 est le carré de 
3 ab et que 25 x 2 y 6 est le carré de 5 xy 3 ; P est donc de la forme 
A 2 -B 2 , expression que l’une des ' identités remarquables 
indiquées au n°3 permet de mettre sous la forme {A - B) 
{A + B) ; donc 

P = (3 ab - 5 xy 3 ) (3 ab + 5 xy 3 ). 

Dans le cas général, la décomposition en facteurs d’un 
polynôme exige l’application de ces méthodes, mais aussi 
d’autres « astuces » de calcul... et une certaine habileté. C’est 
une opération très importante, car elle est à la base de la 
résolution des équations. 

Les fractions rationnelles. 

• Quelques définitions. 

Une fraction rationnelle est une fraction dont le numérateur 
et le dénominateur sont des polynômes. 

— Simplifier une fraction rationnelle, c’est éliminer, au 
numérateur et au dénominateur, les facteurs communs (qui 
peuvent être des coefficients numériques, des monômes ou 
des polynômes). Lorsque tous les facteurs communs ont été 
éliminés, la fraction est dite irréductible. 

— Une fraction rationnelle dont le dénominateur est 
égal à 0 n’a pas de sens : on dit qu’elle n’existe pas. Ainsi la 
fraction : 

A 

a - b 

n’a pas de sens si a = b ; elle a donc pour condition d’exis¬ 
tence b. 

— Pour simplifier une fraction rationnelle, il est néces¬ 
saire de mettre chacun de ses termes sous la forme d’un 
produit de facteurs : d’où l’importance des règles indiquées au 
paragraphe d. 

• Calculs sur les fractions rationnelles. 

Les règles de calcul sont les mêmes que pour les fractions 
ordinaires : réduction au même dénominateur, addition, sous¬ 
traction, multiplication, division, élévation à une puissance, 
extraction de racines se font comme s’il s’agissait d’opérations 
sur des nombres, avec cette différence que les éléments sur 
lesquels on calcule sont des monômes ou des polynômes. 

Par exemple, les fractions rationnelles A/B et C/D, dans 
lesquelles A, B, C et D désignent des polynômes ou des 
produits de polynômes, peuvent être réduites au même déno¬ 
minateur comme des fractions ordinaires : un dénominateur 
commun sera le produit des deux polynômes B et D et l’on 
aura finalement les deux fractions AD/BD et BC/BD. 

Les fractions rationnelles jouent un rôle important en algè¬ 
bre et en analyse : voir pp. 7 à 73. 


CALCUL SUR LES NOMBRES 
COMPLEXES. 


Rappelons que deux nombres complexes z = a + b i et 
z' = a - b i sont dits conjugués ; on a zz' = a 2 + b 2 . Sous sa 
forme trigonométrique un nombre complexe s’écrit : 

z = a + b i = p(cos 0 + i sin 0) (1 ) 

(p: modul e; 0- argument) , et l’on a p 2 = a 2 + b 2 , 
cos 0 = a/Vr + b 2 , sin 0 = b/\/a 2 + b 2 . 


Produit, quotient, puissances. 


1 - Produit. 


2 - Quotient. 


zz' = (aa' - bb') + (ab' + ba') 

= pp'fcos (0 + 0') + i sin (0 + 0')] 

z aa' + bb' ba' - ab'. 


z ' 


2 + b 


72-1 


^[cos (0 - 0 ') + i sin (0 - 0 ')] 


( 2 ) 

(3) 

(4) 


3 - Élévation à la puissance n. 

On montre que pour z = p(cos 0 + i sin 0) : 

z n = p n (cos n0+ i sin n0). (5) 

Dans le cas où p = 1 on obtient la formule de Moivre (1730) : 

(cos 0 + i sin 0) " = cos n0 + i sin n0 . (6) 
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4 - Forme exponentielle d’un nombre complexe. 

z = p(cos 0 + i sin 6 ) = p e ie . ( 7 ) 

Pour p = 1 on a la formule d’Euler : 

e w = cos 0 + i sin 0 . ( 8 ) 


Racines. 


Un nombre complexe z = p (cos 0 + i sin 0 ) possède n raci¬ 
nes n-ièmes données par la formule : 


Vz = Vp (cos 0 + i sin 0 ) = 

0 + 2 k tt 


: Vp(c 


0 + 2 k 


Z Km 
n ) 


(9) 


avec k = 0 , 1 , 2 , (n - 1 ). 

i - vr?vr 


On remarque que le module de i est 1 et son argument 
0 = tt/2. D’où : 

V2 

Vi=± — (1+i) (10) 

et : 

! V3 + i 
2 

-V3 + i ( 11 ) 

2 


2 - vn 

En appelant a la valeur de VTootenue en faisant k = 1 dans 
(9), on montre que toutes les solutions de l’équation z n = 1 
sont de la forme a\ avec k = 0 , 1 , 2 , (2 n - 1 ). 


ALGÈBRE LINÉAIRE. 


Calcul de déterminants. 


Le principe du calcul consiste à chercher (par tâtonnements, 
par intuition, etc.) les combinaisons qui permettent de réduire 
l’ordre du déterminant. On utilise notamment la propriété n° 7 
p. 59 et l’on cherche à faire apparaître des zéros dans les 
lignes ou les colonnes. On développe ensuite le déterminant 
par rapport aux éléments de la ligne ou de la colonne ainsi 
simplifiée, conformément aux formules ( 11 ) et ( 12 ) de la 
propriété n° 6 des déterminants. En procédant de proche en 
proche, on parvient à un déterminant du 2 e ordre. 

Soit par exemple à calculer : 

3 5 10 


D = 


2 


1 


1 


7 


4 5 


4 2 


(D 


-3511 


On remarque qu’en multipliant la troisième ligne par - 2 et 
en l’additionnant avec la deuxième, on va faire apparaître un 
zéro dans la première colonne (2-2 = 0). Voici le calcul 


D = 


3 5 1 

0-13 -4 

1 7 4 

-3 5 1 


0 

1 

2 

1 


( 2 ) 


(les éléments de la troisième ligne donnent -2, - 14, -8 et 
-4; ajoutés aux éléments de la deuxième ligne de (1), ils 
donnent 0, - 13, - 4, 1). 

Multiplions les éléments de la troisième ligne par 3 et 
ajoutons-les aux éléments de la quatrième ligne ; on obtient : 

3 5 10 


D = 


0-13 -4 

1 7 4 


1 


2 


(3) 


0 26 13 7 


Enfin retranchons la troisième ligne de la première, pour 
faire apparaître un troisième zéro : 

0 -16 -11 -6 


D = 


0 -13 - 4 1 
17 4 2 


(4) 


0 26 13 7 
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Les transformations « intérieures » sont terminées (toute 
autre combinaison ferait disparaître un ou plusieurs zéros). 
Appliquons maintenant la formule (12) en développant par 
rapport aux éléments de la première colonrfe : on obtient ici 
(n = 4); 

D= A u a„ + A 21 a 21 + A 31 a 31 + A 41 a 41 . (5) 

Mais comme a n = a 21 = a 41 = 0, (5) devient : 

D = A 31 a 31 = A 31 , ( 6 ) 


A 31 étant le cofacteur de a 31 = 1 ; comme la somme des indices 
3 + 1=4 est paire, A 31 a pour valeur le mineur obtenu en rayant 
la troisième ligne et la première colonne de ( 4 ), soit : 

0 -16 -11 -6 


d = a 3 ,= 


0 -13 
1 7 


4 


4 


1 


2 


0 26 13 7 


-16 -11 -6 
-13 - 4 1 

26 13 7 


(7) 


(7) est un déterminant d’ordre 3 qu’on peut réduire à un 
déterminant d’ordre 2 en faisant apparaître de nouveaux zéros 
dans une ligne ou dans une colonne en utilisant la présence de 
l’élément 1 dans la deuxième ligne. Multiplions donc la deu¬ 
xième ligne par 6 et ajoutons-la à la première ligne, on obtient 
un 0 à la place de - 6 : 

94 -35 0 


D = 


-13 - 4 
26 13 


( 8 ) 


puis multiplions la deuxième ligne par - 7 et ajoutons-la à la 
troisième ligne : 


D = 


94 

-35 

13 

- 4 

17 

41 


(9) 


Développons D par rapport à la troisième colonne ; comme 
celle-ci contient deux éléments nuis (a 13 = a 33 = 0 ), il reste : 

D — A 23 a23 = A23 (10) 

(puisque a 23 = 1). Le cofacteur est le mineur de a 23 = 1, affecté 
du signe « - » (2 + 3 = 5, impair), soit : 


-94 

-35 

117 

41 


D = A 23 = 


On a donc : 

D = - [(- 94 x 41 ) - (- 35 x 117)] = - 241 . 

Inversion des matrices carrées. 

Soit la matrice : 


( 11 ) 


( 12 ) 


(13) 


et cherchons son inverse A \ 

1 - Déterminons les cofacteurs des éléments de A (voir le 
tableau ci-après) : 

2 - Le déterminant D a pour valeur, en développant par rapport 
à la première ligne : 

D = - 21 - 4 = - 25 


(il n’est pas nul, donc la matrice est non singulière). 
3 - La matrice adjointe A* est : 


D’où : 



-7 

-4 

10 

A * = 

-2 

6 

-15 


1 

-3 

- 5 


7 

4 

2 


25 

25 

5 

\ 1 = 

2 

6 

3 


25 

25 

5 


1 

3 

1 


25 

25 

5 


(14) 


(15) 


(16) 


Élément 

a ,j 


Mineur 

M/y 

WÊÊÊ 

i+ > 

Cofacteur 

A/y 

an = 3 


1 - 1 1 

5 2 

= - 7 

2 

- 7 

a 12 — 1 


2 1 

= 4 

3 

- 4 

a 13 = 0 


0 2 

2 ” 1 

0 5 

= 10 

4 

10 

a 21 = 2 


1 0 

5 2 

2 

3 

- 2 

a 22 = — 1 


3 0 

0 2 

= 6 

4 

6 

a 23 = 1 


3 1 

0 5 

= 15 

5 

- 15 

a 31 = 0 

a 32 — 5 


1 o 

-1 1 

3 0 

2 1 

= 1 

= 3 

4 

5 

1 

- 3 

a 33 — 2 


3 1 

2 -1 

= - 5 

6 

- 5 


POLYNÔMES, FRACTIONS RATIONNELLES, 
ÉQUATIONS. 

Compléments sur les polynômes. 

Idéaux de polynômes. 

• Définition. 

Soit l’ensemble des polynômes, K[x ], et un polynôme parti¬ 
culier A de cet ensemble ; les multiples de A forment une 
classe de congruence particulière qui constitue un 
sous-ensemble 3> de K[x], caractérisé par les trois propriétés 
suivantes : 

— 3> contient le polynôme nul ; 

— si deux polynômes A, et A 2 appartiennent à .9, alors 
leur différence A : - A 2 appartient aussi à $ ; 

— si A, appartient à 3>, alors, pour tout B G K[x], le 
polynôme BA appartient aussi à $. 

De façon générale, tout sous-ensemble $ vérifiant ces trois 
propriétés est appelé un idéal de polynômes. 

• Théorème. 

Tout idéal 3> de l’ensemble K[x ] est constitué par l’ensemble 
des multiples d’un même polynôme A. On dit que A engendre 
l’idéal 3>. 


PGCD et PPCM de n polynômes. 

• Composition de l’idéal 3> selon les différents cas 
possibles. 

— Soit $ l’idéal engendré par deux polynômes A et B, 
c’est-à-dire l’ensemble des polynômes de la forme AU + BV. Si 
& = KM. il n’existe pas, au sens strict, un polynôme D de 
degré supérieur ou égal à 1 qui l’engendre ; autrement dit il 
n’existe pas de polynôme qui divise exactement les polynômes 
A et B, qui sont alors dits premiers entre eux. (Il est, certes, 
possible de les diviser par une constante, c’est-à-dire par un 
polynôme de degré zéro, mais cela ne nous avance à rien, pas 
plus, en tout cas, que le fait de diviser par 1 des nombres 
'premiers entre eux.) 

— Si $ est strictement inclus dans KM, alors les 
polynômes qui le constituent sont des multiples d’un polynôme 
D, de degré égal ou supérieur à l’unité, qu’on appelle le plus 
grand commun diviseur (PGCD) de A et B. 

— Le cas 3> = 0 exige que tous les polynômes de $ 
soient nuis ; il ne nous intéresse donc pas. 

• Théorème de Bézout. 

Une condition nécessaire et suffisante pour que deux poly¬ 
nômes A et B soient premiers entre eux est qu’il existe 2 
polynômes U eXV tels que : 

AU + BV = 1 . 

• Propriétés du PGCD. 

— Si l’on multiplie les polynômes A et B par un même 
polynôme P, leur PGCD est aussi multiplié par P ; inversement, 
si l’on divise ces polynômes par l’un de leurs diviseurs 
communs, le PGCD est divisé par ce diviseur. 

— Une condition nécessaire et suffisante pour que des 
polynômes admettent un diviseur commun D comme PGCD est 
que les quotients de ces polynômes par D soient premiers 
entre eux (dans leur ensemble). 

• PPCM. 

— L’ensemble des multiples communs à deux polynô¬ 
mes constitue un idéal de l’anneau des polynômes. Il existe un 
polynôme M dont tous les multiples constituent l’ensemble des 
multiples communs aux deux polynômes ; M est le plus petit 
commun multiple (PPCM) des polynômes considérés. 

— Le PPCM de deux polynômes est égal au quotient de 
leur produit par leur PGCD. 
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ÉQUATIONS 

Théorème de Gauss-D'Alembert. 

Ce théorème, connu aussi sous le nom de théorème fonda¬ 
mental de l’algèbre, s’énonce ainsi : 

Tout polynôme de degré n à coefficients complexes admet n 
racines complexes, distinctes ou non. 

Ce théorème a été affirmé par Girard (1625) et démontré par 
Gauss. 

Pour le démontrer, il faut d’abord démontrer que tout 
polynôme de degré n à coefficients complexes admet au moins 
une racine. Cette démonstration fait appel à l’analyse ; nous 
renvoyons aux traités spécialisés. 


Compléments sur les équations. 


Factorisation du trinôme du second degré. 

Le trinôme du second degré est un polynôme dont la forme 
générale est 

f(x) = ax 2 + bx + c , a ^ 0 , (1 ) 

les coefficients a, b et c appartenant à un corps (ce sont des 
nombres réels dans le cas le plus élémentaire, bien connu des 
lycéens ; mais les coefficients peuvent aussi être complexes). 
Voici les étapes du calcul permettant la mise en facteurs du 
trinôme. 

• On divise par a tous les termes du trinôme, et l’on met 
a en facteur : 


f(x ) = a x 


b c 

— x + — 
a a 


( 2 ) 


• On reconnaît dans x 2 + — x le début du développe¬ 


ment de 


2 a 


; en effet : 


b 
2 a 


2 b b " 

= X +—X +--2 

a 4 a 


(application de l’identité bien connue concernant le carré 
d’une somme). 

On peut donc écrire : 


2 b 
x + — x 
a 


2a 


b' 
4 a 


(3) 


• Portons ce résultat dans (2) ; il vient : 

b 2 

4 a * a 


[K 


f(x) 

qui s’écrit aussi, en effectuant 

f(x) = a . . „ . 
v ' 11 2a 


b -4 ac 
4 a “ 


] 

] 


(4) 


(5) 


cette forme est appelée la forme canonique du trinôme du 
second degré. 

• Si nous nous plaçons dans le corps des réels (c’est-à- 
dire, du point de vue du calcul, si nous considérons qu’un 
nombre négatif n’a pas de racine carrée), nous sommes 
conduits, à ce stade de la décomposition, à distinguer trois 
cas : 

— ou bien la quantité b 2 -4 ac est positive, et alors elle 
possè de deux ra cines carrées réelles opposées, - Vb 2 -4 ac 
et + V b 2 - 4 ac ; 

— ou bien elle est négative, et elle ne possède pas de 
racine carrée réelle ; 

— ou bien elle est nulle, et le trinôme se réduit à 


(” 2 *) 


Appelons A cette quantité, nommée discriminant ; dans le 
premier cas, A admettant les racines ±\ r Â, on peut écrire : 


nx) = a [(* + 2ir) -dh] 


c’est-à-dire : 
f(x) = a 


[7 x+ jl + v^ 

( x + JL 

V4 Y 

V 2a 2a ) 

V 2a 

-2a JJ 


( 6 ) 


(7) 


en appliquant à (6) l’identité 

A 2 - B 2 = (A + B) (A- B), 


avec 



et B = 


Va 

2 a 


Dans le deuxième cas (A< 0), — A est une quantité positive, 

et il en est de même pour —— ; l’égalité (6) s’écrit donc sous 
4 a 2 


la forme 


f(x) = a(P 2 +Q 2 ), 


( 8 ) 


avec 



et le polynôme est irréductible (on ne peut pas le mettre sous la 
forme d’un produit de deux binômes du premier degré). 

Le troisième cas n’exige aucun commentaire. 

• Si nous nous plaçons dans le corps des complexes, 
ces distinctions n’ont plus de raison d’être. Que A soit positif 
ou négatif, il admet toujours deux racines carrées, toutes deux 
réelles si A>0, toutes deu x co mplexes (imaginaires conju¬ 
guées) si A < 0, à savoir ± i V- A. On a donc, dans tous les cas, 
en désignant par VÂ l’une quelconque de ces racines, 


u 3 et v 3 , dont on connaît la somme, S = - q, et le produit, 
P = -p 3 /27, sont racines de l’équation du second degré 
suivante : 

t* + qt-^ = 0, (5) 

dont le discriminant est 


A - a *i±p:- *p +&<* 

* 27 27 

Les racines (réelles ou complexes) de (5) sont : 

,_ Z VÂ et ,„ = - g + 


f(x) = a 






/g\ L’une de ces racines, par exemple t', est égale à u 3 ; l’autre à 
v 3 ; on a donc u = Vf et v = ^ / T, d’où, puisque z = u + v ; 


le cas particulier A = 0 conduisant à : 


f(x) = a 



( 10 ) 


L'équation du second degré. 

Si l’on impose au trinôme du second degré de prendre la 
valeur zéro, nous allons devoir ne donner à la variable x que les 
valeurs qui vérifient l’équation f(x) = 0. 


• Dans le corps des complexes, l’équation du second 
degré admet toujours deux racines, distinctes ou confondues, 
réelles ou complexes. 

Exemple : Résoudre l’équation 2 x 2 - 6 x + 9 = 0. On a 
immédiatement : A = 36 - 72 = - 36. 

— Factorisation du trinôme écrit au premier membre de 
cette équation : 


2 x 2 — 6 x+9 = 2 



V — 36 
4 



x 


6 

4 



z 



4 p 3 + 27 q 
27 



4 p 3 + 27 q 2 
27 


formule — en apparence assez compliquée — connue sous le 
nom de formule de Cardan. 

— Soit, par exemple, u 3 = t' ; alors, comme nous l’avons 
dit, u = VT. Mais, puisque nous sommes dans le champ 
complexe, nous devons tenir compte de ce qu’un nombre 
complexe comme t' possède trois racines cubiques -, si l’on 
nomme l’une d’elles a (réelle ou complexe), les deux autres 
sont ja et j 2 a, j et j 2 étant les racines cubiques imaginaires de 
l’unité. On a donc : 

17, = a, u 2 = \ct, u 3 = j 2 a ; 
et, comme uv = - p/3, d’où v = - p/3 u , 


P 
3 a 

P 

3 f a 


-= “J 


i P 
3a 


3 ja 

V' ( car J = i 2 )- 


— Finalement on obtient les trois racines 



— Pour qu’un produit soit nul, il faut et il suffit qu’un de 
ses facteurs soit nul ; donc les deux racines de l’équation 
proposée sont : 

, 3-3 i 3(1-i) x „ _ 3(1 + i) 

X - 2 - 2 et X 2' 

ce sont deux racines complexes conjuguées. 

• Dans le corps des réels, l’équation précédente aurait 
été dite « impossible » ; on doit donc discuter l’existence des 
racines. 

• D’une manière générale, lorsque les racines existent 
(c’est-à-dire dans tous les cas si l’on se place dans le champ 
complexe, dans certains cas seulement si l’on se limite au 
champ réel) le trinôme du second degré peut s’écrire sou£ la 
forme : 

f(x) = a(x - x') (x - x"), 

x' et x" désignant les deux racines, qui peuvent être confon¬ 
dues en une seule racine, dite racine double, si A = 0. 


p .2 P .2 . P 

Z ’ = “-3T' Z2 = '“- J 3T' Z3 = ) “-*3^ 

les coefficients étant supposés complexes. 

• Cas où /es coefficients p et q sont réels. C’était le cas 
traité par Cardan. Étudions-le d’abord sous son aspect géné¬ 
ral. La résolution de l’équation z 3 + pz+q = 0 conduit à 

n 3 

résoudre l’équation du second degré f + qt — ^= 0, dont 

le discriminant, A = 4 P + 27 q , est du même signe que 

4 p 3 + 27 q 2 (la division par 27 — nombre positif — n’intervient 
pas quant au signe de A ). Si nous nous reportons au tableau 
résumant la discussion de l’équation du second degré dans le 
cas de coefficients réels, nous voyons que : 

— Si Zl>0, f et f sont des racines réelles; par 
conséquent VT = a est réelle. Mais les deux autres racines 
cubiques de t', à savoir jaet j 2 a, sont complexes (nous n’avons 
pas le droit de les oublier!). Donc z, est réel, z 2 et z 3 sont 
complexes conjugués. 

— Si A = 0, t = f = nombre réel ; donc u = v = a = Vf 
est réel et j a et j 2 a sont, ici encore, complexes conjugués. 

— Si A < 0, f et f (c’est-à-dire u 3 et v 3 ) sont complexes 
conjugués, ainsi donc que u et v (puisque le produit uv est réel 
et égal à - p/3) ; donc z = u + v est réel et l’équation admet 
trois racines réelles, z,, z 2 , z 3 . 


Équation du troisième degré : 

ax 3 + bx 2 + ex + d = 0 . 

La méthode de Tartaglia-Cardan repose sur une série de 
«trouvailles» et d’idées audacieuses. 


• Méthode générale de résolution. 

— On divise tous les termes par a, ce qui donne 
l’équation suivante, équivalente à l’équation proposée : 


x 3 + -x 2 + -x +- = 0. (1) 

a a a 

— On remplace x par l’inconnue z, telle que 

z= x + ~~, transformation qui a pour effet de faire disparaî- 
3 a 

tre le terme en x 2 et de conduire à l’équation équivalente 
z 3 + pz + q = 0 . (2) 

— Pour résoudre (2), on pose z = u + v, et l’on obtient 
l’équation 


u 3 + v* + (u + v)(3 uv + p) + q = 0. (3) 

— Si u + v vérifie (2) et si 3 uv + p = 0, on aboutit au 
système équivalent 


qui s’écrit aussi : 


uv 



} 



(4) 


(4') 


Équation du quatrième degré : 

ax 4 + bx 3 + ex 2 + dx + e = 0 . 


La méthode de Ferrari consiste : 

— à diviser tous les termes par a, pour obtenir une 
équation de la forme : 


x 4 + px 3 + qx 2 + rx + s = 0 ; 


— à décomposer le premier membre en un produit de 
trinômes du second degré en considérant que x 4 + px 3 est le 

début du développement du carré de|x 2 +-^x + Xj, \ étant 


déterminé par les conditions du calcul (conditions qui condui¬ 
sent à une équation du troisième degré, dont l’inconnue est \, 
et qui est résolue par la formule de Cardan. 

On obtient alors l’équation sous la forme : 


(Ax 2 + Bx + C) (A' x 2 + B' x + C') = 0 , 


et l’on trouve, sans difficulté, ses quatre racines (deux pour 
chaque trinôme), qui sont toutes complexes si les coefficients 
a, b, ... sont complexes, réelles ou complexes conjuguées si 
les coefficients sont réels. 

— Remarque : La méthode ressemble à celle qui est 
employée pour l’équation du second degré, pour laquelle on 


utilisait le début du développement de |x + , comme on l’a 

indiqué ci-dessus (discriminant) et comme on l’enseigne dans 
tous les manuels scolaires élémentaires. La méthode de 
Ferrari conduit généralement à des calculs compliqués. Dans 
la pratique, on cherche à simplifier le problème en utilisant — 
avec l’astuce que donne l’expérience du calcul algébrique — 
les particularités de l’équation proposée. 
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GÉOMÉTRIE ÉLÉMENTAIRE 


Principaux résultats 
de la géométrie classique. 

La géométrie classique est celle qu’on enseigne 
encore dans les établissements scolaires. Elle présente 
un double intérêt : 1° elle habitue de jeunes esprits, 
peu entraînés à l’abstraction, à raisonner avec rigueur 
sur des notions voisines de l’expérience concrète 
quotidienne ; 2° elle est commode : quand nous cher¬ 
chons combien de rouleaux de papier peint sont 
nécessaires pour tapisser notre chambre, nous faisons 
un calcul d’aires en utilisant les formules de la géomé¬ 
trie classique ; de même — et d’une façon un peu plus 
compliquée — nous faisons usage de la science eucli¬ 
dienne pour tracer le plan d’une maison ou d’un pont, 
pour représenter en projection un objet quelconque, 
etc. 

Nous avons expliqué comment cette géométrie 
n’était qu’un cas particulier, une application très limi¬ 
tée, des géométries abstraites et générales édifiées par 
les mathématiciens du XIX e et du XX e siècle, et il nous 
a semblé inutile d’en reprendre systématiquement les 
propositions et les démonstrations, au demeurant faci¬ 
les à retrouver dans n’importe quel manuel scolaire 
élémentaire. Par contre, il est sans doute intéressant de 
regrouper les résultats classiques en un bref répertoire 
alphabétique, débarrassé de l’armature logique qui a 
été présentée et commentée pp. 75 à 88 ; c’est ce 
que nous faisons dans ce qui suit. Le lecteur — et en 
particulier l’élève débutant — y retrouvera sans 
difficulté la définition, la règle, la propriété, la formule 
dont il peut avoir besoin. 

• Adjacent. Adjectif signifiant contigu ; 
s’emploie surtout en parlant d'angles. Deux angles 
sont dits « adjacents » s’ils ont même sommet, un côté 
commun, et s’ils sont situés de part et d’autre de ce 
côté commun. Une propriété importante : deux angles 
adjacents supplémentaires ont leurs côtés non 
communs en ligne droite ; deux angles adjacents 
complémentaires ont leurs côtés non communs per¬ 
pendiculaires. 

• Aigu (en parlant d’un angle). Angle inférieur à 
un angle droit (voir angle). 

• Aires. On appelle aire un nombre mesurant 
une surface. Voici les formules donnant les aires des 
surfaces les plus usuelles. 


1° Surfaces planes. 

S désigne l’aire considérée. 

— Carré de côté a : S = a 2 . 

— Rectangle de longueur L et de largeur / : 
S = L x /. 

— Parallélogramme de hauteur h relative à un 
côté de longueur b : S = b x h. 

— Losange de diagonales d et d': 
S = (d x d')/2. 

— Trapèze de bases B et b, de hauteur h : 

(B + b)x h 


— Polygone quelconque : on décompose le 
polygone en différentes parties (généralement des 
triangles), obtenues en menant, par exemple, les dia¬ 
gonales issues d’un même sommet, et on calcule l’aire 
de chacune dé ces parties ; l’aire du polygone est la 
somme de ces aires partielles. 

— Cercle de rayon R et de diamètre D = 2 R : 


2 D 

S = ttR (voir pi ). 

— Secteur circulaire d’angle a et de rayon R : 
„ R 2 a 

a en radians : S =-; 

2 

_ tt R a 

a en degres : S = ——— ; 

360 
_ 2 

_ tt H a 

a en grades : S = ————— . 


2° Surfaces des polyèdres. 

A = aire latérale du polyèdre, S = aire totale = aire 
latérale + aires des bases. 

— Prisme droit de hauteur H et de périmètre de 
base p : A = p x H. 

— Parallélépipède rectangle d’arêtes a, b, c : 
S = 2 (ab + bc+ ca). 

— Cube d’arête a : S = 6 a 2 . 

— Pyramide régulière (périmètre de base = p, 
apothème = a, apothème de la base = b) : 

A _ P xa . c . P( a + b) 


— Tronc de pyramide régulier (périmètres des 
bases = p et p', apothème a) : 

(p + p ') a 
2 


3° Surfaces courbes. 

Mêmes notations. 

— Cylindre droit à base circulaire (rayon de 
base = R, hauteur = H) : 

A = 2 tt RH, S = 2 ttR(R + H). 

— Cône droit à base circulaire (rayon de 
base = R, génératrice = a) : 

A = tt Ra , S = tt R(R + a). 

— Tronc de cône droit à bases circulaires 
(rayons des bases R et r, génératrice = a) : 

A = tt (R + r) a, S = ttR(R + a) + tt r(r + a). 

— Surface engendrée par un segment AB = a 
tournant autour d’un axe situé dans le même plan que 
AB mais ne le traversant pas : 

S = 2 tt A' B'. 10 (voir figure 1 ). 

— Surface engendrée par une ligne polygonale 
régulière tournant autour d’un diamètre du cercle 
inscrit ne la traversant pas (voir figure 2) : 


— Triangle : en appelant a, b, c les longueurs 
des trois côtés : h, h', h" les hauteurs correspondant 
respectivement à ces côtés ; 2 p le périmètre 

(2 p = a + b + c) ] R le rayon du cercle circonscrit ; r le 
rayon du cercle inscrit, on a : 


ah bh' 
~ 2~~2 


ch " 
~2~ 


= pr 


= Vp(p - a) (p - b)(p - c) 
_ abc 
~4~R' 


— Triangle rectangle d’hypoténuse a : 

ah bc 
2 ~ 2 ' 


— Polygones réguliers inscrits ou circonscrits à 
un cercle de rayon R : 


Polygone 

Inscrit 

Circonscrit 

Triangle 

3 R 2 V3 

3 R 2 V 3 

équilatéral 

4 

Carré 

2 R 2 

4 R 2 

Hexagone 

3 R 2 V3 

2 R 2 V3 

convexe 

2 

Octogone 

convexe 

2 R 2 V2 

8 R 2 (V2 - 1) 

Pentagone 

5R 2 V10 + 2V5 


convexe 

8 





Décagone 

5 R 2 VlO - 2 V5 


convexe 

4 



S = 2 -nr. A' B'. 

— Aire de la sphère (rayon = R, diamètre = D) i 
S = 4 ttR 2 — ttD 2 . 

— Zone sphérique (rayon de la sphère : R ; 
hauteur de la zone : H) : S = 2 ttRH. 

— Fuseau sphérique (angle dièdre a) : 
S = 2 R 2 a (a en radians). 

• Angle. Portion de plan limitée par deux 
demi-droites (les côtés de l’angle) issues d’un même 
point (sommet de l’angle). Pour la mesure des angles, 
voir p. 89. Un angle plat est un angle dont les côtés 
sont dans le prolongement l’un de l’autre ; un angle 
droit est la moitié d’un angle plat. Lorsqu’une droite 
coupe deux autres droites (voir figure 3) on a les 
définitions suivantes : 

1 et 5 : angles alternes-externes ; 3 et 4 : angles 
alternes-internes ; 2 et 4 : angles intérieurs et d’un 
même côté ; 3 et 5 : angles correspondants. 

• Angle dans l'espace. Étant donné deux droites 
D et D', l’angle de ces deux droites dans l’espace est 
l’angle que forment deux parallèles à D et D' menées 
d’un point O quelconque. 

• Angle d’une droite et d’un plan. C’est l’angle 
aigu formé par la droite et sa projection orthogonale 
sur le plan. 

• Angle de deux plans. Voir dièdre. 

• Apothème d’un polygone régulier. C’est le 
rayon du cercle inscrit au polygone. En appelant a 
l’apothème, c le côté du polygone, R le rayon du cercle 
circonscrit, on a : 



• Apothème d'une pyramide régulière. C’est la 
hauteur d’une de ses faces, issue du sommet de la 
pyramide. 

• Arc de cercle. Portion de cercle limitée par 
deux points. 

• Axe radical de deux cercles. C’est l’ensemble 
des points qui ont même puissance par rapport à ces 
deux cercles (voir : Puissance). Appelons O et O' les 
centres des deux cercles, / le milieu de OO', A le point 
où l’axe radical, perpendiculaire à OO', coupe OO', on 
a : 


On a aussi, pour tout polygone régulier, en appelant 
a l’apothème et p le périmètre : 


S 


a x p 
2 


2 OO'. IA = R 2 - R’ 2 . 

Si les cercles sont sécants, leur axe radical est la corde 
commune prolongée indéfiniment ; s’ils sont tangents, 
c’est la tangente commune au point de contact des 
deux cercles. S’ils sont extérieurs ou intérieurs, il faut 


faire une construction spéciale ; l’axe radical ne coupe 
aucun des deux cercles. 

• Bissecteur d’un dièdre : Demi-plan issu de 
l’arête qui divise le dièdre en deux dièdres égaux. Tout 
point du bissecteur est équidistant des deux faces du 
dièdre, et, inversement, tout point intérieur au dièdre 
équidistant de ses deux faces est dans le bissecteur. 

• Bissectrice d’un angle. Demi-droite issue du 
sommet qui partage l’angle en deux angles égaux. Un 
point intérieur à un angle est équidistant des deux 
côtés de cet angle si, et seulement si, il est situé sur la 
bissectrice de cet angle. 

— 4 Dans un triangle, il y a trois angles, donc trois 
bissectrices intérieures et trois bissectrices extérieu¬ 
res. Les bissectrices intérieures sont concourantes au 
centre du cercle inscrit au triangle ; les bissectrices 
extérieures concourent deux à deux avec la bissectrice 
intérieure du troisième angle au centre du cercle 
exinscrit dans le troisième angle. 

— Propriétés des bissectrices dans un triangle 
(voir figure 4) : 

DR = DC D' B _ D' C _ ac 

AB ~ AC ' AB ~ AC ’ B ~ b + c ’ 


DS= b-T7 ib>o). 

D et D' sont conjugués harmoniques par rapport à B et 
C. AB .AC = AD 2 + BD . DC = BD'. D' C - AD' 2 . 


AD = bc - - 


' bc 


(b +cf 


(b -c)‘ 


i - bc 

(b > c). 


• Capable (arc). Arc de cercle tel que, de chaque 
point M appartenant à l’arc considéré, on voit un 
segment donné sous un angle donné a (figure 5). 


• Carré. Parallélogramme dont les quatre côtés 
sont égaux et dont les angles sont droits. Pour inscrire 
un carré dans un cercle, on trace deux diamètres 
perpendiculaires dont on joint les extrémités. En appe¬ 
lant a le côté : diagonale = a y/2, rayon du cercle 
„ a V2 

circonscrit R = —-— . 


• Centre de gravité d’un triangle. Point de 
concours des médianes. Il est situé aux deux tiers de 
chaque médiane à partir du sommet correspondant. Il 
est aligné avec le centre O du cercle circonscrit et 
l’orthocentre H, et se trouve au tiers du segment OH à 
partir de O. 

• Cercle. Courbe plane fermée dont tous les 
points sont à la même distance R (rayon) d’un point 
fixe intérieur ( centre) ; inversement, si un point M est à 
la distance OM = R de O, il appartient au cercle. Voici 
quelques propriétés classiques du cercle. 

— Tout cercle partage le plan en deux régions ; 
la région intérieure contient le centre O et tout 
point M' de cette région est tel que OM' < R ; la région 
extérieure contient les points M" tels que OM" > R. 

— Tout diamètre est axe de symétrie ; le cen¬ 
tre O est centre de symétrie. 

— Soit une droite D, d la distance de O à cette 
droite. Si d = 0, D est un diamètre ; si d = R, D est 
tangente au cercle ; si 0 < d < R, D est sécante au 
cercle (deux points communs) ; si d> R, D est exté¬ 
rieure au cercle. 

— Positions relatives de deux cercles de 
rayons R et R' ; OO' = d. 

d > R + R' : cercles extérieurs ; 

d = R + R' : cercles tangents extérieurement ; 

d = I R - R' I : cercles tangents intérieurement ; 

d = 0 : cercles concentriques ; 

d < I R - R' I : cercles intérieurs ; 

\ R - R' \ < d < R + R' : cercles sécants. 

— Figures caractéristiques dans un cercle : voir 
figure 6. 

— Angle de deux cercles sécants : c’est l’angle 
que font les tangentes aux deux cercles en l’un des 
deux points communs. Si cet angle est droit, les 
cercles sont dits orthogonaux ; on a alors, avec 
d = OO', R 2 + R' 2 = d 2 . 

— Construction d’un cercle passant par trois 
points donnés A, B, C : on mène les médiatrices de 
deux quelconques des segments AB, AC et BC ; le 
centre du cercle cherché est leur intersection. 

— La longueur de la circonférence est / = 2 tt R. 

• Circonscrit. Cercle circonscrit à un triangle : 
cercle passant par ses trois sommets. S’il existe un 
cercle passant par tous les sommets d’un polygone, ce 
cercle est dit circonscrit à ce polygone. 

— Dans le cas d’un triangle, le centre du cercle 
circonscrit est le point de concours des médiatrices du 
triangle ; son rayon R est donné par les formules 
ci-dessous (voir aussi aire) : 

R _ abc __ abc _ 

4 S 4 Vp(p - a)(p - b)(p - c) ’ 


sin A sin B sin C 


• Complément (d’un angle). Angle qu’il faut 
ajouter à un angle donné pour obtenir un angle droit. 

• Complémentaire. Angles complémentaires : 
angles dont la somme est égale à un angle droit. 

• Concourantes (droites). Droites ayant un point 
commun. Dans un triangle, les droites remarquables 
suivantes sont concourantes : hauteurs (concourantes 
à l’orthocentre H du triangle), médiatrices (centre du 
cercle circonscrit), médianes (centre de gravité), bis¬ 
sectrices intérieures (centre du cercle inscrit dans le 
triangle), une bissectrice intérieure et les bissectrices 
extérieures des deux autres angles (centre d’un cercle 
exinscrit). 







en pointillé : arc capable de l’angle a 
relativement aux segments A B 



BOC = 0 = angle ou centre. 

(i = 2 a 

Arc de longueur 1= /3 radians = 

Si a = 1 droit, BC est un diamètre. 
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• Cône. Solide limité par une surface conique à 
une nappe et par un plan rencontrant toutes les 
génératrices ; l’intersection du plan et de la surface 
conique est la base du cône ; la distance du sommet S 
au plan est la hauteur du cône. 

— Cône à base circulaire : cône dont la direc¬ 
trice (base) est un cercle. 

— Cône de révolution (cône droit à base circu¬ 
laire) : cône à base circulaire dont le sommet se trouve 
sur l’axe du cercle de base. Un cône de révolution est 
engendré par un triangle rectangle tournant autour 
d’un des côtés de l’angle droit. 

— Plan tangent : le plan tangent en M (distinct 
du sommet S) à un cône contient les tangentes en M à 
toutes les courbes tracées sur le cône et passant par M. 
Il contient aussi la génératrice SM et la tangente à la 
directrice au point A où SM coupe cette directrice. 

— Cône circonscrit à une sphère : cône de 
révolution dont les génératrices sont tangentes à la 
sphère. Son axe est le diamètre de la sphère passant 
par le sommet. 

• Conique (surface). Une surface conique est la 
surface engendrée par une droite D passant par un 
point fixe S et se déplaçant en s’appuyant sur une 
courbe plane (C) appelée directrice de la surface. Le 
point S est le sommet, la droite D, mobile, la généra¬ 
trice. Une surface conique se compose de deux nap¬ 
pes séparées par le sommet ; chaque nappe est engen¬ 
drée par une des demi-droites d’origine S portéej 
par D. 

• Conjugués harmoniques. Voir harmonique. 

• Couronne. Portion de plan située entre deux 
cercles concentriques. Si l’on appelle R et R' les 
rayons des deux cercles, l’aire de la couronne est 
donnée par : S = tt{R 2 - R' 2 ). 

• Cube. Solide appartenant à la famille des 
parallélépipèdes. Un cube possède six faces égales (six 
carrés), huit sommets et huit arêtes égales. Il possède : 
un centre de symétrie (point de concours des diagona¬ 
les), neuf axes de symétrie et neuf plans de symétrie. 
En désignant par a la longueur commune des arêtes, la 
sphère inscrite a pour rayon a/2 ; la sphère circons¬ 
crite a pour rayon a . 

• Cylindre. Solide limité par une surface cylin¬ 
drique, et deux plans parallèles rencontrant les généra¬ 
trices. Les courbes d’intersection de la surface par ces 
deux plans sont les bases du cylindre. La distance 
entre les plans des deux bases est la hauteur du 
cylindre. Un cylindre à base circulaire est un cylindre 
dont la base est un cercle ; il est dit de révolution si, en 
outre, les génératrices sont perpendiculaires au plan 
de base. L’axe du cercle de base est alors l’axe du 
cylindre. Comme pour le cône (voir ce mot), on définit 
les plans tangents à un cylindre et le cylindre circons¬ 
crit à une sphère (un cylindre est un cône dont le 
sommet S est reporté à l’infini). 

• Cylindrique (surface). Surface engendrée par 
une droite qui reste parallèle à une direction fixe et qui 
s’appuie sur une courbe fixe (directrice). 

• Décagone. Polygone à dix côtés. Construction 
du décagone régulier inscrit dans un cercle de cen¬ 
tre O et de rayon R : on trace un cercle auxiliaire de 
diamètre PO = R et la tangente OA à ce cercle ; on 
mène AO', qui coupe le cercle auxiliaire en M et M' ; on 
a AM = c (côté du décagone convexe) et AM' = c' 
(côté du décagone étoilé). On reporte ces longueurs 
consécutivement sur le cercle (O, R) et l’on obtient le 
décagone demandé (figure 7). 

En appelant A l’angle du décagone, a l’angle au 
centre, c le côté, a l’apothème, on a : 


Décagone convexe : 

A = 144°, 
a = 36°, 

c =f(V5-1), 

a - y VlÔ + 2 V5. 

4 


Décagone étoilé : 

'fr= 72°, 
a' = 108°, 

R 

c' = -(V5 + 1), 

a' = y VlO -2V5. 

4 


• Demi-plan. Portion de plan limitée d’un côté 
par une droite et illimitée de l’autre. 

• Développement (d’une surface). Figure plane 
obtenue quand on étale sur un plan la surface latérale 
de certains solides : c’est un rectangle pour un prisme 
droit, un secteur polygonal régulier pour la pyramide 
régulière, un rectangle pour le cylindre de révolution, 
un secteur circulaire pour le cône de révolution. 

• Diagonale (d’un polygone ou d’un polyèdre). 
Segment qui joint deux sommets (non consécutifs 
pour un polygone, non situés sur une même face pour 
un polyèdre). Dans un parallélogramme, les diagonales 
se coupent en leur milieu ; en outre, si le parallélo¬ 
gramme est un rectangle, elles sont égales ; dans un 
losange, elles sont, de plus, perpendiculaires. Dans un 
parallélépipède rectangle d’ arêtes a, b, c, la diagonale 
d a pour longueur : d = Va + b 2 + c . 

• Diamètre (d’un cercle ou d’une sphère). Droite 
passant par le centre de ce cercle ou de cette sphère. 

• Dièdre. Portion d’espace limitée par deux 
demi-plans issus d’une même droite ; les demi-plans 
sont les faces, la droite I arête du dièdre (image : un 
livre ouvert ; le « dos » du livre est l’arête, le dièdre est 
la portion d’espace comprise entre les deux pages du 
livre, supposées planes et indéfiniment prolongées à 
l’infini). Un dièdre peut être plat (les deux faces dans le 
prolongement l’une de l’autre), droit (les deux faces 
perpendiculaires). La section d’un dièdre par un plan 
perpendiculaire à l’arête détermine sur les deux faces 
un angle appelé rectiligne du dièdre. 

• Distance d’un point à une droite. Longueur 
comprise entre le point et le pied de la perpendiculaire 
menée du point à la droite. 

• Distance d’un point à un plan. Même défini¬ 
tion, mais en remplaçant « droite » par « plan ». 


• Dodécagone. Polygone à douze côtés. Cons¬ 
truction du dodécagone régulier inscrit dans un cer¬ 
cle : on construit d’abord l’hexagone inscrit, puis les 
bissectrices des angles au centre dont les côtés pas¬ 
sent par les sommets de l’hexagone, ce qui donne, sur 
le cercle, les six autres sommets du dodécagone 
cherché (l©s six premiers sont ceux de l’hexagone 
inscrit). 

• Enveloppe. Courbe fixe à laquelle une courbe 
variable reste constamment tangente. 

• Équilatéral (triangle). Triangle dont les trois 
côtés sont égaux. Ses angles sont aussi égaux et valent 
60° chacun. En appelant c le côté, a l’apothème, h la 
hauteur, R le rayon du cercle circonscrit et r celui du 
cercle inscrit, on a : 

c V3 3 R c V3 R c V3 

= T' a=r= — = 2 ’ —' 

• Exinscrit (cercle). Cercle tangent aux prolon¬ 
gements des deux côtés de l’un des angles d’un 
triangle et au troisième côté de ce triangle. Son centre 
est à l’intersection de la bissectrice intérieure de 
l’angle considéré et des bissectrices extérieures des 
deux autres angles du triangle. 

• Fuseau sphérique : Portion de surface sphéri¬ 
que comprise entre deux demi-grands cercles de 
même diamètre. 

• Gauche (surface). Surface dont tous les points 
ne sont pas dans un même plan. 

• Grand cercle. Sur une sphère : cercle tracé sur 
la sphère et dont le centre (et le rayon) sont ceux de la 
sphère en question (parmi tous les cercles tracés sur la 
sphère, les grands cercles sont ceux dont le rayon est 
maximal). 

• Harmonique. Se dit en particulier d’une divi¬ 
sion formée par quatre points A, B, C, D alignés, tels 
que les deux premiers divisent le segment admettant 
les deux autres pour extrémités selon un même rap¬ 
port, c’est-à-dire que l’on ait, en valeur absolue : 

A et B sont alors dits conjugués harmoni- 

AD BD 

ques par rapport à C et D. Inversement, C et D sont 
conjugués harmoniques par rapport à A et S. Les 
quatre points étant donnés dans l’ordre A, B, C, D, s’ils 
sont en division harmonique, sont tels que les 
segments AB et CD se chevauchent (par exemple A à 
l’extérieur de CD et B à l’intérieur, ou le contraire). 

• Harmonique (faisceau) : ensemble de quatre 
droites issues d’un même point O et passant par quatre 
points qui forment une division harmonique. O est le 
sommet du faisceau, ces droites sont ses rayons. Les 
rayons sont dits deux à deux conjugués harmoniques 
par rapport aux deux autres. 

Principales propriétés des faisceaux harmoniques : 

1° Un faisceau harmonique détermine sur une 
sécante quelconque une division harmonique. 

2° Pour que quatre droites concourantes for¬ 
ment un faisceau harmonique, il faut et il suffit que 
trois d’entre elles déterminent sur une parallèle à la 
quatrième des segments égaux. 

3° Deux rayons conjugués d’un faisceau sont 
perpendiculaires si, et seulement si, ils sont les bissec¬ 
trices des angles formés par les deux autres rayons. 

• Harmonique (relation). Si l’on tient compte 
des mesures algébriques des segments, on exprime 
que quatre points, A, B, C, D, forment une division 
harmonique par : 

ÂC ~BC 

~ÂD ~BD' 

—- Appelons a, b, c, d les abscisses de A, B, C, 
D ; la relation précédente conduit à : 

(a + b)(c+d) = 2(ab+cd). 

Si l’on prenjj comme origine le point A (a = 0), cette 
relation devient : 

1 1 2 

b{c+d) = 2cd, ou — + — = — . 

c d b 

Si l’on prend comme origine le milieu / du segment 
AB (a = - b), elle devient : 

a 2 = cd, soit /A 2 = IB 2 = ÏC . 15. 

• Hauteur. Propriétés des hauteurs d'un trian¬ 
gle. On démontre que l’on a, avec les notations h a , h b , 
h c pour les hauteurs respectivement issues des 
sommets A, S et C : 

bc = 2 Rh g ; h a = | V~p(p^ r à)(p^ 7 b)(p~ :r c) 

(formules analogues pour h b et h c . 

On a aussi : 

ah a = bh b = ch c = 2 S et les relations trigonométri- 
ques suivantes : 

h a = csin B = b sin C ; 
h b = a sin C = c sin A ; 
h c = b sin A = asin B. 

• Hexagone. Polygone à six côtés et six som¬ 
mets. Relations concernant l’hexagone régulier inscrit 
dans un cercle de centre R : 

angle du polygone = 120° ; angle au centre = 60° ; 
côté = R. 

• Homologues (éléments) : éléments qui se cor¬ 
respondent dans deux figures. 

• Homothétie: voir ci-dessous, C. 

• Hypoténuse. Côté d’un triangle rectangle qui 
est opposé à l’angle droit. L’hypoténuse est diamètre 
du cercle circonscrit au triangle et égale au double de 
la médiane issue du sommet de l’angle droit. Si l’on 
appelle A le sommet de l’angle droit, BC l’hypoténuse, 
H le pied de la hauteur issue de A sur BC, on a les 
relations suivantes dites relations métriques dans le 
triangle rectangle : AB 2 = BH . BC, AC 2 = CH . CB, 
AH 2 = BH . HC, AB 2 + AC 2 = BC 2 . Cette dernière rela¬ 
tion traduit le théorème de Pythagore. 

• Inscrit (angle). Angle ayant son sommet sur un 
cercle et dont les côtés sont, soit deux cordes du 


cercle, soit une corde et une tangente (voir figure à 
l’article cercle). 

• Inscrit (cercle). Un cercle est dit inscrit dans 
un angle ou dans un polygone lorsqu’il est tangent aux 
côtés de l’anqle ou à ceux du polygone. Son centre est 
sur la bissectrice intérieure s’il s’agit d’un angle, et au 
point de concours des trois bissectrices intérieures s’il 
s’agit d’un triangle. Le cercle inscrit dans un losange 
ou un carré a son centre au point de rencontre des 
diagonales. 

• Inversion. (Voir ci-dessous p. 146, Transfor¬ 
mations). 

• Isocèle (triangle). Triangle qui possède deux 
côtés égaux. Leur sommet commun est le sommet du 
triangle, le côté opposé au sommet est la base. Dans un 
triangle isocèle, les angles à la base sont égaux et la 
bissectrice intérieure de l’angle au sommet est aussi 
médiatrice, hauteur et médiane. Les réciproques de 
ces deux propriétés sont vraies. 

(Employé à propos d’un trapèze, le mot isocèle 
désigne un trapèze dont les côtés non parallèles sont 
égaux.) 

• Lieu géométrique. Terme utilisé par les géo¬ 
mètres classiques pour désigner un ensemble de 
points possédant tous une même propriété et étant les 
seuls à la posséder. Ainsi l’on disait que la médiatrice 
d’un segment est le lieu géométrique des points équi¬ 
distants des extrémités de ce segment (tout point sur la 
médiatrice est équidistant de ses extrémités ; tout 
point équidistant des extrémités du segment est néces¬ 
sairement sur la médiatrice). 


• Médiane. Droite qui joint un sommet d’un 
triangle au milieu du côté opposé. Les médianes d’un 
triangle sont concourantes au centre de gravité de ce 
triangle. Si l’on désigne par m la longueur de la 

a 2 

médiane relative au côté a on a : b 2 + c 2 = 2 m 2 + —. 


2 


On a aussi, en appelant Hl la projection de la 
médiane relative au côté a sur ce côté (H : pied de la 
hauteur issue_de A, / milieu du côté considéré): 
c 2 -b 2 = 2 a. Hl. 


• Médiateur (plan). On appelle plan médiateur 
d’un segment AB le plan mené par le milieu / de AB et 
perpendiculaire à AB. Le plan médiateur est l’ensemble 
des points de l’espace équidistants de A et de B. 

• Médiatrice (d’un segment AB). Droite perpen¬ 
diculaire au segment AS et passant par le milieu de AS. 
C’est l’ensemble des points du plan équidistants de A 
et de B. Construction : avec A comme centre, on trace 
un cercle de diamètre supérieur à AS, puis, en conser¬ 
vant la même ouverture du compas, on trace un cercle 
de centre S ; les deux points d’intersection de ces 
deux cercles appartiennent à la médiatrice : il suffit de 
les joindre pour obtenir celle-ci. 

• Neuf points (cercle des). Cercle passant par 
les neuf points suivants d’un triangle : les milieux des 
trois côtés, les pieds des trois hauteurs, les milieux des 
trois segments joignant chaque sommet à l’orthocen- 
tre H du triangle. Le cercle des neuf points, ou cercle 
d’Euler, a pour centre le milieu du segment OH (O 
centre du cercle circonscrit) et pour rayon R/2. 

• Oblique. Étant donné, dans le plan, une droi¬ 
te D et un point A situé hors de cette droite, on appelle 
oblique tout segment joignant un point de D à A qui 
n’est pas perpendiculaire à D. Une oblique est plus 
longue que la perpendiculaire abaissée de A sur D ; 
deux obliques qui s’écartent également du pied de la 
perpendiculaire sont égales ; de deux obliques qui 
s’écartent inégalement du pied de la perpendiculaire, 
la plus longue est celle qui s’en écarte le plus. Les 
réciproques de ces propriétés sont vraies. 

• Obtus (angle). Angle saillant supérieur à 1 

Droit. 

• Octogone. Polygone à huit côtés. Pour cons¬ 
truire un octogone régulier inscrit dans un cercle, on 
trace deux diamètres perpendiculaires, qui coupent 
chacun le cercle en deux points, et les bissectrices de 
deux angles droits consécutifs ainsi tracés, ce qui 
donne quatre autres points. Les huit points obtenus 
sont les sommets de l’octogone cherché. On a : 

Octogone convexe: angle = 135°, angle au 

centre = 45°, côté = R V2 - V2. 

Octogone étoilé: angle = 45°, angle au 

centre = 135°, côté = R V2 + V2. 

• Opposés par le sommet (angles). Angles ayant 
même sommet et tels que les côtés de l’un sont les 
prolongements des côtés de l’autre. Deux angles oppo¬ 
sés par le sommet sont égaux, et leurs bissectrices 
sont dans le prolongement l’une de l’autre. 

• Orthocentre (d’un triangle). Point de concours 
des hauteurs de ce triangle. L’orthocentre, le centre du 
cercle circonscrit et le centre de gravité d’un triangle 
sont alignés sur une droite appelée droite d’Euler. 

• Orthogonal. 

— Droites orthogonales : deux droites D et D', 
du plan ou de l’espace, sont dites orthogonales lors¬ 
que, en menant par un point A de D une parallèle à D', 
on obtient une troisième droite, D", perpendiculaire à 
D. Dans le plan, deux droites orthogonales sont per¬ 
pendiculaires (ce qui signifie : 1° qu’elles se coupent ; 
2° qu’elles se coupent à angle droit). 

— Cercles orthogonaux : cercles sécants qui se 
coupent à angle droit (voir cercle). 

• Parallèles. Deux droites situées dans un même 
plan sont dites parallèles si elles n’ont aucun point 

- commun. Voici quelques propriétés classiques : 

— Par un point pris hors d’une droite, on peut 
mener une parallèle à cette droite, et une seule (cette 
proposition était appelée autrefois « postulat 
d’Euclide »). 

— Si deux droites sont perpendiculaires à une 
même troisième, elles sont parallèles entre elles. 

— Si deux droites sont parallèles, toute droite 
qui coupe l’une coupe l’autre. 

— Si deux droites distinctes sont parallèles à 
une même troisième, elles sont parallèles entre elles. 


A 



Si AB = BC = CD = DE 
A B’ = BC' = C'D' = DE’ 
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— Si deux droites sont parallèles, toute perpen¬ 
diculaire à l’une est perpendiculaire à l’autre. 

— Deux droites parallèles coupées par une 
sécante forment avec cette sécante : des angles alter- 
nes-internes égaux, des angles correspondants égaux, 
des angles alternes-externes égaux, des angles inté¬ 
rieurs et du même côté supplémentaires. La réciproque 
de chacune de ces propriétés est vraie. 

— Des parallèles équidistantes (déterminant sur 
une perpendiculaire commune des segments égaux) 
déterminent sur une sécante quelconque des 
segments consécutifs égaux (voir figure 8). 

— Théorème de Thalès : voir Thalès. 

• Parallélisme dans l’espace. Si l’on considère 
les droites de l’espace, il faut préciser, pour pouvoir 
parler de leur parallélisme, qu’elles sont dans un même 
plan (dans l’espace, deux droites non situées dans un 
même plan n’ont aucun point commun : elles ne sont 
cependant pas parallèles). 

— Deux droites parallèles déterminent un plan. 

— Si deux droites sont parallèles, tout plan qui 
coupe l’une coupe l’autre, tout plan perpendiculaire à 
l’une est perpendiculaire à l’autre, tout plan parallèle à 
l’une est parallèle à l’autre ou la contient, toute droite 
orthogonale à l’une est orthogonale à l’autre. 

— Deux droites distinctes parallèles à une 
même troisième sont parallèles entre elles. 

— Si deux droites distinctes sont perpendiculai¬ 
res à un même plan, elles sont parallèles. 

— Si deux angles ont leurs côtés parallèles et de 
même sens, ou parallèles et de sens contraires, ils sont 
égaux ; si deux angles ont leurs côtés parallèles, deux 
de même sens, et deux de sens contraires, ils sont 
supplémentaires. 

— Si deux droites sont parallèles, leurs projec¬ 
tions orthogonales sur un même plan sont parallèles 
ou confondues. (La réciproque n’est pas vraie.) 

• Parallélisme entre une droite et un plan. Une 
droite et un plan sont dits parallèles s’ils n’ont aucun 
point commun. 

— Une droite est parallèle à un plan si, et 
seulement si, elle est parallèle à une droite du plan. 

— Si une droite est parallèle à un plan P, tout 
plan contenant cette droite, ou bien est parallèle à P, 
ou bien coupe P selon une parallèle à cette droite. 

— Si une droite est parallèle à deux plans, elle 
est parallèle à leur intersection. 

— Si une droite est parallèle à un plan P et 
perpendiculaire à un plan Q, les plans P et Q sont 
perpendiculaires. 

— Par un point donné O, on peut mener une 
infinité de plans parallèles à une droite D ; par un point 
donné O, on peut mener un plan parallèle à deux 
droites données, D et D', non parallèles. Étant donné 
deux droites non parallèles, D et D', on peut mener par 
D un plan parallèle à D', et un seul. 

• Plans parallèles. Deux plans sont dits parallè¬ 
les lorsqu’ils n’ont aucun point commun. On démontre, 
à propos des plans parallèles, des propriétés analo¬ 
gues à celles des droites parallèles (deux plans dis¬ 
tincts parallèles à un même troisième sont parallèles 
entre eux, etc.). 

• Parallélépipède. Prisme ayant pour base un 
parallélogramme. Lorsque les arêtes latérales sont 
perpendiculaires au plan de base, le parallélépipède 
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est dit droit. Lorsque la base est un rectangle, le 
parallélépipède est dit lui-même rectangle. Un parallé¬ 
lépipède rectangle dont les arêtes sont toutes égales 
est un cube. 

• Parallélogramme. Quadrilatère convexe dont 
les côtés opposés sont parallèles. Dans un parallélo¬ 
gramme : les angles opposés sont égaux, les angles 
consécutifs sont supplémentaires, les côtés opposés 
sont égaux deux à deux, les diagonales se coupent en 
leur milieu (centre du parallélogramme). Réciproque¬ 
ment, si un quadrilatère possède l’une de ces proprié¬ 
tés, ce quadrilatère est un parallélogramme. 

Le rectangle, le losange et le carré sont des parallé¬ 
logrammes particuliers. 

• Partage d'un segment dans un rapport donné. 
Étant donné un segment AB et un rapport k (positif), il 
existe en général deux points, M et M', tels que : 

MA M'A 
MB ~ M' B ~ ‘ 

(Si l’on considère des segments orientés, il n’existe 
qu’un seul point M partageant le segment AB dans un 
rapport algébrique k : M est situé entre A et B si k est 
négatif, extérieur au segment AB si k>e st positif.) 

• Pentagone. Polygone à cinq côtés et cinq 
angles. Il existe deux pentagones réguliers : l’un est 
convexe et l'autre étoilé. 

— Construction des pentagones réguliers ins¬ 
crits dans un cercle de diamètre AB : on trace le rayon 
OC perpendiculaire à AB et, avec /, milieu de AO, 
comme centre, on trace le cercle de rayon IC, qui 
coupe le diamètre AB en un point M (intérieur au 
cercle) et un point M' (extérieur au cercle). CM et CM' 
sont respectivement les côtés des pentagones convexe 
et étoilé (voir figure 9). 


Pentagone convexe 

angle =108°, 

angle 

centre - 72°, côté c = 

-VlO -2 V5. 

2 


Pentagone étoilé : 

angle = 36°, 

angle 

centre = 144°, côté c = 

- VlO + 2 V5. 

2 



• Pente (d'une droite). La pente d’une droite par 
rapport à un axe x' x est la tangente de l’angle que fait 
cette droite avec l’axe x' x. La pente d’une droite par 
rapport à un plan est la tangente de l’angle que fait 
cette droite avec sa projection orthogonale sur ce plan. 
Si la droite est parallèle au plan, sa pente est nulle ; si 
la droite est perpendiculaire au plan, sa pente est 
infinie. 

• Périmètre. Ligne limitant une surface. Ce peut 
être une ligne brisée (exemple : polygones), une ligne 
courbe (exemple : cercle, ellipse), ou une série de 
lignes courbes et droites (périmètre mixtiligne). 

• Perpendiculaire. Deux droites sont dites per¬ 
pendiculaires quand elles se coupent à angle droit. On 
démontre les propriétés suivantes : 

— Par un point d’une droite on peut lui mener 
une perpendiculaire et une seule ; par un point pris 
hors d’une droite, on peut lui mener une perpendicu¬ 
laire et une seule. 

— Si deux droites sont parallèles, toute perpen¬ 
diculaire à l’une est perpendiculaire à l’autre. 

— La perpendiculaire menée d’un point à une 
droite est plus courte que toute oblique menée à la 
droite à partir de ce point. 

• Perpendiculaire à un plan (droite). Une droite 
est dite perpendiculaire à un plan P si elle est orthogo¬ 
nale ou perpendiculaire à toute droite appartenant à P. 

— Une droite est perpendiculaire à un plan si, et 
seulement si, elle est orthogonale à deux droites 
concourantes de ce plan. 

— Si deux droites sont parallèles, 'tout plan 
perpendiculaire à l’une est perpendiculaire à l’autre. 
Inversement, si deux droites sont perpendiculaires à un 
même plan, elles sont parallèles. 

— Par un point, on peut mener une droite 
perpendiculaire à un plan, et une seule ; par un point, 
on peut mener un plan perpendiculaire à une droite, et 
un seul. 

— L’ensemble des droites passant par un point 
O et perpendiculaires ou orthogonales à une droite 
donnée D est le plan perpendiculaire à la droite D 
passant par O. 

— Théorème des trois perpendiculaires : si on 
mène d’un point O la perpendiculaire OH à un plan P 
et la perpendiculaire 0/ à une droite D de ce plan, la 
droite Hl qui joint les pieds des deux perpendiculaires 
est elle-même perpendiculaire à D. 

• Perpendiculaires (plans). Deux plans qui se 
coupent en formant un dièdre droit (donc quatre 
dièdres droits) sont dits perpendiculaires. 

— Deux plans sont perpendiculaires si, et seule¬ 
ment si, l’un d’entre eux contient une droite perpendi¬ 
culaire à l’autre. 

— Si deux plans non parallèles sont perpendi¬ 
culaires à un même troisième, leur intersection est 
perpendiculaire à ce dernier. 

— Si une droite est perpendiculaire à un plan P, 
tout plan parallèle à la droite est perpendiculaire à P. 

— Si une droite n’est pas perpendiculaire à un 
plan P, il existe un plan, et un seul, perpendiculaire à P 
et contenant la droite considérée. 

• Perpendiculaire commune à deux droites 
dans l’espace. C’est une droite AB rencontrant les 
deux droites données et perpendiculaire à chacune 
d’elles. La portion de la perpendiculaire commune 
comprise entre les deux droites est la plus courte 
distance des deux droites. 

• Plan. Une image d’un plan est donnée par la 
surface d’un mur ou d’une table, supposée prolongée 
indéfiniment dans tous les sens, et sans épaisseur. 
Voici les principales propriétés d’un plan : 

— Toute droite qui a deux points dans un plan 
est tout entière dans ce plan. 

— Si une droite n’est pas contenue dans un 
plan, elle a 0 ou 1 point commun avec ce plan. 

— Une droite détermine dans un plan deux 
demi-plans. 

— Un plan est déterminé par : trois points non 


alignés, deux droites concourantes, une droite et un 
point extérieur à cette droite, deux droites parallèles. 

— Si deux plans ont un point commun, ils en ont 
une infinité, qui forment leur droite d’intersection, ou 
bien ils sont confondus. 

• Polyèdre. Solide limité par des polygones, 
appelés faces ou facettes du polyèdre. Un polyèdre à 
quatre faces est un tétraèdre, un polyèdre à six faces 
est un hexaèdre, etc. (Un cube est un hexaèdre.) Un 
polyèdre est dit régulier lorsque ses faces sont des 
polygones réguliers égaux. On démontre qu’il existe 
cinq polyèdres réguliers, et cinq seulement : le tétraè¬ 
dre régulier, le cube, l’octaèdre (huit faces), le dodé¬ 
caèdre (douze faces) et l’icosaèdre (vingt faces). 

Voir aussi le mot volume. 


• Polygonale (ligne). Portion d’un polygone. 

• Polygone. Ligne brisée fermée. Les segments 
composant cette ligne sont les côtés du polygone, 
l’angle formé par deux côtés consécutifs est un angle 
du polygone. L’angle formé par un côté et le prolonge¬ 
ment d’un côté consécutif est un angle extérieur du 
polygone. Un polygone est dit concave si les prolonge¬ 
ments d’un ou plusieurs de ses côtés le coupent ; il est 
dit convexe dans le cas contraire (figure 10). 

— Somme des angles d’un polygone : la somme 
des angles intérieurs d’un polygone à n côtés est 2 
(n-2) Droits. La somme des angles extérieurs d’un 
polygone convexe est toujours égale à 4 Droits, quel 
que soit n. 

• Polygones réguliers. Un polygone est dit régu¬ 
lier lorsque tous ses côtés sont égaux et tous ses 
angles aussi. Il peut être convexe ou étoilé. 

— Un polygone régulier quelconque peut être 
inscrit dans un cercle et circonscrit à un autre cercle 
concentrique au premier. Il a autant d’axes de symétrie 
que de côtés : les bissectrices des angles et les 
médiatrices des côtés. Si le nombre de côtés est pair, il 
admet, en outre, le centre de son cercle circonscrit 
comme centre de symétrie. 

• Prismatique (surface). Surface engendrée par 
une droite qui reste parallèle à une direction donnée D 
et qui s’appuie constamment sur un polygone (voir 
figure 11). Elle est donc composée de portions de plan 
(faces) parallèles à la direction D. La droite commune à 
deux faces consécutives est une arête. Lorsqu’on 
coupe une surface prismatique par un plan non paral¬ 
lèle à ses arêtes, on obtient une section plane de la 
surface. Si le plan sécant est perpendiculaire aux 
arêtes, on obtient une section droite de la surface ; 
toutes les sections droites sont des polygones égaux 
entre eux. 


• Prisme. Solide limité par une surface prismati¬ 
que et deux sections planes parallèles (les bases). La 
portion de surface prismatique comprise entre les 
bases est la surface latérale. Les arêtes de la surface 
latérale sont les arêtes latérales. La distance entre les 
plans des deux bases est la hauteur du prisme. 

— Lorsque les arêtes latérales sont perpendicu¬ 
laires aux plans des bases, le prisme est dit droit ; il est 
oblique dans le cas contraire. 


• Ptolémée (relations de). Étant donné un qua¬ 
drilatère convexe inscriptible (voir quadrilatère) ABCD, 
en posant AC = x, BD = y, AB = a, BC = b, CD = c, 
DA = d, on a les relations suivantes, appelées relations 
de Ptolémée : 

x ad + bc 

— = —---, xy = ac + bd . 

y ab + cd 


• Projection orthogonale sur une droite. La 
projection orthogonale d’un point M sur une droite est 
le pied m de la perpendiculaire abaissée de M sur la 
droite ; cette perpendiculaire s’appelle la projetante. 
La projection d’un segment MM' est un segment mm' 
tel que mm' = MM', cos a, a désignant l’angle que fait 
la droite sur laquelle on. projette avec la droite portant 
MM'. 

• Projection orthogonale sur un plan. La projec¬ 
tion orthogonale d’un point sur un plan est le pied de la 
perpendiculaire abaissée du point considéré sur le 
plan de projection. On démontre les propriétés sui¬ 
vantes : 

—S_a projection d’une droite est, en général, 
une droite passant par l’intersection de la droite et du 
plan de projection (trace de la droite sur le plan). Elle 
se réduit à un point si la droite est perpendiculaire au 
plan. 

— Si une droite est parallèle à un plan, sa 
projection sur ce plan lui est parallèle. 

— Si deux droites sont parallèles, leurs projec¬ 
tions sur un plan sont parallèles ou confondues (mais 
la réciproque n’est pas vraie). 

— Une figure plane se projette en vraie gran¬ 
deur sur un plan parallèle au sien. 

— Un segment MM' se projette en mm' tel que 
mm' = MM'. cos (MM', P), (MM', P) désignant l’angle 
que fait MM' avec le plan P. Une surface plane S située 
dans un plan -Q, se projette selon une surface plane S’ 
telle que S' = S cos a, a étant l’angle des deux plans P 
et Q. 

• Puissance d’un point par rapport à un cercle. 
Étant donné un point P et une droite passant par P 
coupant un cercle (O, R) en deux points A et B, le 
produit p = PA . PB est constant, quelle que soit la 
droite PAB : on l’appelle puissance du point P par 
rapport au cercle. Si l’on pose PO = d, on a : 

p = d 2 - R 2 . 

— Le nombre p est positif si P est extérieur au 
cercle, négatif si P est intérieur au cercle, nul si P est 
sur le cercle. 

— Lorsque les points A et B sont confondus en 
un point T, PT étant tangente au cercle, on a p = PT 2 . 

• Puissance d'un point par rapport à une 
sphère. Elle se définit comme la puissance d’un point 
par rapport à un cercle, A et S étant les points 
d’intersection d’une droite passant par P avec la 
sphère. 

• Pyramide. Polyèdre obtenu en joignant tous 
les sommets d'un polygone plan (base) à un point S 


non contenu dans le plan de base et appelé sommet de 
la pyramide. Quand le polygone de base est régulier, la 
pyramide est dite régulière si le point S est situé sur la 
perpendiculaire menée par le centre du polygone de 
base au plan de ce polygone. 

• Pythagore (théorème de): Dans un Triangle 
rectangle, le carré de l’hypoténuse est égal à la somme 
des carrés des deux autres côtés. La réciproque de 
cette proposition est vraie. 

• Quadrilatère. Polygone à quatre côtés. Il peut 
être convexe, concave ou croisé. Un quadrilatère est 
dit inscriptible lorsqu’on peut faire passer un cercle par 
ses quatre sommets. On démontre qu’un quadrilatère 
convexe est inscriptible si, et seulement si, ses angles 
opposés sont supplémentaires. Un quadrilatère croisé 
est inscriptible si, et seulement si, ses angles opposés 
sont égaux. 

— Les côtés opposés d’un quadrilatère convexe 
inscriptible forment deux couples de droites dites 
antiparallèles. 

• Rectangle. Parallélogramme ayant un angle 

droit. 


• Relations métriques. 

— Dans le triangle rectangle : voir Hypoténuse. 

— Dans un triangle quelconque (figure 12): 

AB 2 = AC 2 + BC 2 - 2 BC . CH (C aigu), 

AB 2 = AC 2 + BC 2 + 2 BC. CH (C obtus). 

Ces deux relations, si l’on oriente le côté BC, se 
réunissent en : 

AB 2 = AC 2 + BC 2 + 2 BC . CH. 

AB 2 + AC 2 = 2 Al 2 + (I milieu de BC). 

AC 2 - AB 2 = 2 CB . IH (en orientant BC). 

• Rentrant (angle). Angle plus grand qu’un 
angle plat. 

• Révolution (surface de). Surface obtenue en 
faisant tourner autour d’un axe une ligne (L), droite, 
brisée ou courbe. Tout plan passant par l’axe est un 
plan méridien, qui coupe la surface suivant une ligne 
appelée méridienne. 

m Saillant (angle). Angle inférieur à un angle 
plat. Un angle saillant peut être aigu, droit ou obtus. 

• Sécante. Droite ou courbe rencontrant une 
autre ligne ou une surface. 

• Segment de droite. Portion de droite limitée 
par deux points. Sur une droite orientée un segment 
peut être associé à un nombre positif, négatif, ou nul 
(lorsque les deux extrémités sont confondues). On le 
représente alors avec une barre : AB. 

• Semblable. Voir Similitude. 


• Similitude. Cette transformation est étudiée au 
§ C. Retenons ici la relation de similitude entre deux 
triangles : des triangles qui ont leurs angles égaux 
chacun à chacun, et leurs côtés proportionnels, sont 
dits semblables. On a alors, pour deux triangles ABC et 
A' B’ C' : 



A'B' B'C' C'A'' 


Il y a trois cas de similitude qui énoncent les 
conditions suffisantes auxquelles deux triangles sont 
semblables : 1 er cas : deux angles égaux chacun à cha¬ 
cun ; 2 e cas : un angle égal compris entre deux côtés 
proportionnels ; 3 e cas : trois côtés proportionnels. 


• Simson (droite de). Tout point M du cercle 
circonscrit à un triangle a ses projections sur les trois 
côtés du triangle en ligne droite. Cette droite est la 
droite de Simson relative au point considéré. 


• Sphère. Solide engendré par un demi-cercle 
qui tourne autour de son diamètre. Tous les points 
situés sur la surface de la sphère sont équidistants d’un 
point intérieur O appelé centre. Toute droite passant 
par le centre est un diamètre. Tout plan passant par le 
centre est un plan diamétral. Le centre est un centre de 
symétrie, tout diamètre est un axe de symétrie, tout 
plan diamétral est un plan de symétrie, 

— La sphère détermine dans l’espace deux 
régions, l’une intérieure, l’autre extérieure à la sphère. 

— Positions relatives d’une droite et d’une 
sphère : une droite peut être sécante (deux points 
communs), tangente (un point commun), ou extérieure 
à la sphère (zéro point commun), selon que la distance 
au centre à la droite est inférieure au rayon, égale au 
rayon, ou supérieure au rayon. Quand la droite est 
tangente à la sphère en un point M, elle est perpendi¬ 
culaire au rayon OM en M. 

— Positions relatives d'un plan et d’une sphère : 
un plan peut être sécant, tangent, ou extérieur à la 
sphère dans les mêmes conditions qu’une droite. 
Lorsque le plan est sécant, il découpe sur la sphère un 
cercle dont le centre est la projection orthogonale du 
centre de la sphère sur le plan : grand cercle s’il passe 
par le centre, petit cercle au cas contraire. 

— Le plan tangent à la sphère en un point M est 
l’ensemble des tangentes en M à toutes les courbes 
tracées sur la sphère et passant par M. Il est perpendi¬ 
culaire au rayon aboutissant au point de contact. 

— On étudie, comme pour le cercle, les posi¬ 
tions relatives de deux sphères, la puissance d’un point 
par rapport à une sphère. 

— On appelle zone sphérique la portion de la 
surface d’une sphère comprise entre deux plans paral¬ 
lèles et calotte sphérique la portion de la surface d’une 
sphère comprise entre un plan tangent et un plan 
sécant parallèle à ce dernier. 

— Figures liées à la sphère : elles sont décrites 
sur les figures 13, 14 et 15. 

• Supplément (d'un angle). Angle qu’il faut 
ajouter à un angle donné pour obtenir un angle plat. 

• Supplémentaires (angles). Angles dont la 
somme vaut un angle plat. Deux angles adjacents sont 
supplémentaires si, et seulement si, leurs côtés non 



polygone étoilé 
( pentagone régulier étoilé ) 

10 



Anneau sphérique : volume engendré par le 
segment de cercle AB tournant autour du 
diamètre x'x. 


145 


















GÉOMÉTRIES NON EUCLIDIENNES 


communs sont en ligne droite. Leurs bissectrices 
forment un angle droit. 

• Surface. La notion de surface en général est 
très difficile à définir. En géométrie classique, qui est 
une abstraction réalisée à partir de notre expérience 
quotidienne, une surface est un ensemble de points 
limitant une portion d’espace. Il ne faut pas la confon¬ 
dre avec la notion d aire, qui désigne la mesure d’une 
surface. Voir Aire. 

• Symétrie. Voir ci-dessous, Transforma¬ 
tions. 

• Tangente. Considérons une ligne courbe et 
deux points M et M' sur cette ligne ; la droite MM' est 
sécante à la courbe, qu’elle rencontre au moins aux 
deux points M et M'. Quand le point M' tend vers M (se 
rapproche indéfiniment de M), la droite MM’ tend (du 
moins dans les cas étudiés en géométrie classique) 
vers une position limite, qu’on appelle tangente à la 
courbe au point M (une tangente à une courbe peut 
avoir plusieurs points communs avec la courbe, 
comme l’indique la figure 16). 

— Tangente à un cercle : Dans le cas particulier 
d’un cercle, une tangente n’a qu'un point commun 
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jlume engendré par le , 
tournant autour de x'x. 


avec le cercle. On démontre qu’elle est perpendiculaire 
au rayon qui aboutit au point de contact, et que, d’un 
point extérieur A, on peut mener au cercle deux 
tangentes AM et AM' ; on a alors AM = AM'. 

— Tangente à une surface. Soit M un point de 
cette surface. La tangente en M à une courbe quelcon¬ 
que tracée sur là surface et passant par M est dite 
tangente en M à cette surface. L’ensemble des tangen¬ 
tes en M à une surface constitue, en général, le plan 
tangent en M à cette surface. 

L’importance de la notion de tangente et de plan 
tangent, en ce qui concerne l’étude des courbes, est 
très grande. Les méthodes de la géométrie tradition¬ 
nelle ne permettent d’étudier qu’un très petit nombre 
de cas ; pour étudier d'une manière générale les 
questions de tangence, il faut utiliser l’analyse. 

• Tétraèdre. Polyèdre à quatre faces, quatre 
sommets et six arêtes. On peut le considérer comme 
une pyramide à base triangulaire. 

• Thalès (théorème de). Importante proposition 
concernant les droites parallèles : si des droites sont 
parallèles, elles déterminent sur deux sécantes des 
segments correspondants proportionnels, et, récipro¬ 
quement, des droites qui déterminent sur deux sécan¬ 
tes des segments homologues proportionnels sont 
parallèles. 

• Translation. Voir ci-dessous, Transforma¬ 
tions. 

• Trapèze. Quadrilatère ayant deux côtés paral¬ 
lèles (les bases) et deux côtés non parallèles. 

• Triangle. Polygone possédant trois côtés et 
trois angles. Les droites remarquables dans un triangle 
sont toutes au nombre de trois : bissectrices intérieu¬ 
res, bissectrices extérieures, hauteurs, médianes, 
médiatrices. 

— La somme des angles d’un triangle est égale 
à 2 Droits. 

— Les droites remarquables d’un triangle sont 
concourantes trois à trois (voir Médiatrices, etc.). 

— Dans un triangle, un côté quelconque est 
inférieur à la somme des deux autres et supérieur à leur 
différence. 

• Trièdre. Portion d’espace limitée par les por¬ 
tions de plan comprises entre trois demi-droites issues 
d’un même point S, prises deux à deux. S est le 
sommet, les demi-droites sont les arêtes, les portions 
de plan sont les faces, et les dièdres formés par les 
faces sont les dièdres du trièdre. 

Un trièdre dont les faces sont des angles droits £st 
un trièdre trirectangle. 


• Tronc de cône. Portion de cône comprise 
entre la base et un plan parallèle au plan de base. 

• Tronc de prisme. Portion de prisme comprise 


entre deux sections planes non parallèles entre elles ni 
parallèles aux arêtes. 

• Tronc de pyramide. Portion de pyramide 
comprise entre la base et un plan parallèle au plan de 
base 

• Vecteur géométrique. Voir p. 48. 

• Volume. Portion d’espace occupée par un 
solide. Voici les formules donnant les volumes les plus 
usuels. 

a, b, c désignent les longueurs des arêtes, h la 
hauteur, B l’aire de la base, D le diamètre de la base, R 
le rayon de la base ; les autres symboles seront 
éventuellement précisés. 

1° Polyèdres. 


— Cube : 

— Parallélépipède 
droit ou oblique : 

— Parallélépipède 
rectangle : 

— Prisme : 

V = a 3 . 

V= Bh. 

V = abc = Bc. 

V= Bh. 

— Pyramide . 

-c 

ta 

I- ICO 

II 

— Tronc de 
pyramide : 

h _ 

V = -(B + B' + VBS') 


(B 1 = 2 e base). 

2° Corps ronds. 


— Cylindre : 

V = Bh = tt R 2 h. 

— Cône : 

1 1 2 

V = -Bh =j-TtR 2 h . 

3 3 

— Sphère : 

H -" 3 

— Tronc de cône à 
bases circulaires : 

V =^Tzh(R Z + RR' 

+ R' 2 ). 


3° Volume du tore : Le tore est le solide engen¬ 
dré par un cercle qui tourne autour d’une droite située 
dans son plan et ne le coupant pas. En appelant d la 
distance du centre du cercle à l’axe de rotation et R le 
rayon du cercle, on a : 

S = 4 tt 2 Rd, V = 2 7t 2 R 2 d . 



15 


Segment sphérique : volume compris entre 
deux sections planes parallèles, de diamètre 
AA' et BB'. Si l'une des bases est réduite 
à un point, P par exemple, on a un segment 
sphérique à une seule base. 



La droite (A) est tangente en M à la courbe, 
qu'elle rencontre, par ailleurs, en A, B, C et D. 


Les géométries non euclidiennes. 

D'Euclide aux temps modernes. 

Dès le début du XVII e siècle, les mathématiciens ont souligné 
ce que Sir Henry Savile appelait l’un des deux « naevi » 
(« défauts ») de la géométrie d’Euclide, à savoir l’axiome des 
parallèles (par un point pris hors d’une droite, on peut mener 
une parallèle à cette droite, et une seule). Le deuxième défaut, 
qui ne nous intéressera pas ici, concerne la théorie des 
proportions. 

Dans les Éléments, Euclide fait reposer l’ensemble de sa 
géométrie sür un certain nombre de prémisses : des défini¬ 
tions, des axiomes (c’est-à-dire des propositions logiques, 
évidentes (?) par elles-mêmes) et cinq postulats, c’est-à-dire 
des propositions que l’on demande d’admettre sans démons¬ 
tration. Le cinquième de ces postulats est énoncé £insi : « ... si 
une ligne droite coupant deux autres lignes droites fait, du 
même côté, des angles intérieurs dont la somme soit moindre 
que 2 Droits, les deux droites, prolongées indéfiniment, se 
rencontrent du côté des angles dont la somme est inférieure à 
2 Droits ». Ce « postulat d’Euclide » est équivalent à l’axiome 
des parallèles, qui l’a remplacé, par la suite, dans les traités de 
géométrie. A partir des remarques de Savile, plusieurs tentati¬ 
ves furent faites pour démontrer ce postulat, mais en vain. 

En 1733, l’Italien Saccheri publie à Milan un livre intitulé 
Euclides ab omni vindicatus, dans lequel il défend la position 
euclidienne en raisonnant ainsi : si l’axiome des parallèles est 
lié logiquement aux autres propositions des Éléments, le fait 
de le nier et de le remplacer par une autre proposition doit 
conduire à des contradictions logiques. Saccheri envisage 
donc la question sous l’angle suivant (voir figure ci-dessous) : 

Malheureusement, Saccheri n’a pu développer les consé¬ 
quences de la deuxième et de la troisième hypothèses (s’il 
l’avait fait, il se serait aperçu qu’elles n’entraînaient aucune 
contradiction, mais qu elles conduisaient à des propriétés 
différentes des figures). 

Lobaôevskij. 

Professeur de mathématiques à l’Université de Kazan, Loba- 
ôevskij a construit une géométrie en remplaçant le postulat 


d’Euclide par la proposition suivante: «Toutes les lignes 
droites d’un plan qui sont issues d’un point donné peuvent être 
divisées en deux classes, selon leur relation avec les autres 
droites du même plan : la classe des droites sécantes et celle 
des non sécantes. La ligne droite qui fait, en quelque sorte, 
office de frontière pour chacune de ces classes est appelée 
parallèle à la droite considérée. » Il en résulte qu’une ligne 
droite peut être parallèle à deux droites qui se coupent. 

En développant les conséquences de ce nouveau postulat, 
Lobaôevskij a pu construire une géométrie cohérente, sans 
contradictions (et, en outre, sans aucun rapport avec l’expé¬ 
rience). La conclusion de cette tentative était la suivante : le 
choix d’un postulat n’a pas de conséquences sur la valeur 
logique d’une géométrie ; donc ce postulat est indémontrable. 

La tentative de Lobaôevskij date du début du XIX e siècle ; 
elle avait été précédée d’une tentative analogue faite par 
Gauss, lequel n’avait pas publié ses résultats. Après Loba¬ 
ôevskij, le Hongrois Bolyaï a repris le problème et est parvenu 
à des résultats très voisins. 

Riemann et Beltrami. 

La « dissertation inaugurale » de Riemann (1854) a relancé le 
problème des géométries non euclidiennes. Le mathématicien 
allemand a montré, par des moyens analytiques, que le 
problème des postulats était lié à celui de la courbure de 
l’espace dans lequel on se place. Sur une sphère, par exemple, 
le plus court chemin d’un point à un autre est un arc de 
grand-cercle. Un grand-cercle est donc l’équivalent d’une 
droite pour une telle surface, et l’on sait que deux grands- 
cercles quelconques ont toujours deux points communs, 
c’est-à-dire que, sur une sphère, d’un point pris hors d’une 
« droite » (c’est-à-dire d’un grand-cercle) on ne peut mener 
aucun autre grand-cercle qui lui soit parallèle (non sécant). 
Beltrami (1835-1900) a établi la relation entre les travaux de 
Riemann et ceux de Lobaôevskij et de Bolyaï. 

Cayley. 

Arthur Cayley a montré (Collected Mathematical Papers, 
1889, tome II) que les propriétés métriques d’une figure plane, 
auxquelles s’étaient uniquement intéressés Lobaôevskij, 


Bolyaï et Riemann, ne sont autres que les propriétés projecti¬ 
ves de la figure reliées à une certaine quadrique (surface 
représentée par une équation du second degré) fondamentale. 
Selon que la quadrique considérée est réelle, imaginaire ou 
dégénérée, on obtient différentes géométries. Les travaux de 
Cayley ont été développés par Félix Klein (1849-1925), puis par 
Sophüs Lie. 

Transformations. 

Pôles et polaires. 

• Faisceaux de cercles. 

— Définition : ensemble des cercles admettant, deux à 
deux, une même droite pour axe radical. 

Tous ces cercles ont leurs centres situés sur une même 
droite. 

— Genre d’un faisceau : selon que l’axe radical est 
extérieur à un cercle du faisceau, le coupe en deux points A et 
B, ou lui est tangent en A, le faisceau est dit à points limites 
(ces points sont deux cercles de rayon nul, / et J, sur la ligne 
des centres), à points de base A et B (tous les cercles du 
faisceau passent par A et B), ou un faisceau singulier (tous les 
cercles du faisceau sont alors tangents à l’axe radical en A). 

• Points conjugués par rapport à un cercle ; pôles et 
polaires. 

— Définition : deux points, M et M' sont dits conjugués 
par rapport à un cercle (C) si le cercle de diamètre MM' est 
orthogonal au cercle (C). 

— Polaire d’un point A par rapport au cercle (C) de 
centre O et de rayon R : c’est l’ensemble des conjugués de A 
par rapport à (C) ; c’est la droite (A) perpendiculaire à OA en A' 
tel que ÜÂ.ÔÂ = R 2 . 

— Pôle d’une droite (A) ne passant pas par O : toute 
droite (A) ne passant pas par le centre peut être considérée 
comme la polaire d’un point A, appelé pôle de la droite {A). Si 
le pôle d’une droite (A) est sur une droite (A’) et le pôle de (A') 
est sur (A), les droites (A) et (A') sont dites conjuguées ; elles 
sont les polaires de deux points conjugués, et réciproquement. 


c o 


A 

n - c= 

B 


1 re hypothèse : 


les deux perpendiculaires AC et BD 
sont égales et les angles ? et D sont droits 
(= « postulat » d'Euclide). 



les deux perpendiculaires AC et BD 
sont égales et les angles C et D sont obtus 
(figure impossible à dessiner). 



les deux perpendiculaires AC et BD 
sont égales et les angles C et D sont aigus 
(figure impossible à dessiner). 
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— Réciprocité polaire : les pôles de toutes les droites 
passant par un point A sont situés sur la polaire (A) de A ; les 
polaires de tous les points d’une droite (A) passent par le pôle, 
A, de cette droite. 

• Transformation par polaires réciproques par rapport à 
un cercle (C) de centre O. 

— Définition : transformation non ponctuelle qui fait 
correspondre : 

1° à tout point M du plan (autre que O) sa polaire, par 
rapport au cercle (C) ( cercle directeur de la transformation) ; 

2° à toute droite du plan autre qu’un diamètre de (C), 
son pôle par rapport à (C). 

Au centre O et à un diamètre de (C) correspondent respecti¬ 
vement une droite dite droite de l’infini du plan et un point à 
l’infini dans la direction perpendiculaire au diamètre consi¬ 
déré. 

— Ainsi, aux points et aux droites d’une figure F 
correspondent les droites et les points d’une figure F, de sorte 
que, aux propriétés de F correspondent des propriétés de F, 
dites corrélatives (par exemple, à des points alignés dans F, 
correspondent des droites concourantes dans F, etc.). 

— Courbes polaires réciproques : courbes telles que 
chacune d’elles est l’enveloppe des polaires des points de 
l’autre et, en outre, l’ensemble des pôles des droites tangentes 
à l’autre courbe. 

— La polaire réciproque d’un cercle (K) par rapport à 
(C) est une conique (F) qui a pour foyer le centre O de (C), 
pour directrice associée à ce foyer la polaire du centre o) de (K) 

D 

par rapport à (C). Son excentricité est e = — avec d = coA. 

d 

Transformations ponctuelles - Généralités. 

• Définitions. 

— E et E' étant deux ensembles de points (MeF, 
M' G E'), on appelle transformation ponctuelle toute applica¬ 
tion de E dans E'. M ' est le transformé de M et nous écrirons, 
en appelant T l’application (la transformation) : M' = T(M). Si 
M appartient à un sous-ensemble F de E (à une figure F), M' 
décrit un sous-ensemble P de E' (une figure P), et l’on écrit : 
P = T(F). Dans ce qui suit, nous poserons E = plan euclidien 
ou E = espace euclidien. 

— Si, ViW, T(M) = T'(M), T et T sont des transforma¬ 
tions équivalentes (à tout point M de E elles font correspondre 
un même transformé M'). 

— Si tout point M' G E' est le transformé d’un seul point 
M G E, la transformation est dite biunivoque. 

— Si T(M) = M, M est un point double pour la transfor¬ 
mation T. 

• Remarques complémentaires. 

— Si, V/W G E, on a T(M) = M, la transformation est dite 
identique ; on la note alors T°, ou / : 

M = l(M) = F(M). 

— Une figure dont tous les points sont des points 
doubles est dite invariante point par point (ne pas confondre 
avec une figure globalement invariante, dont les points ne sont 
pas des points doubles, mais sont deux à deux homologues 
dans la transformation). 

— Étant donné une transformation biunivoque T, 
M' = T(M), si on peut trouver une transformation, notée T~\ 
qui, à tout M' G E', fait correspondre son antécédent M dans 
E : 

M' = T(M)0 M = T\M'), 

la transformation P 1 est dite transformation réciproque de T. 
Si T = T \ la transformation est dite involutive. 

• Produit de deux transformations. 

— Définition : soit 7^ et T 2 telles que F, = T^F) et 
F = F 2 (F 1 ) : la figure P peut aussi s’obtenir directement à 
partir de F par une transformation T appelée produit des 
transformations T, et T 2 . On note ce produit par le signe « ° » et 
l’on écrit : 

T = T 2 ° T, (lire : « T 2 rond T 1 »). 

Attention à Vordre des deux transformations : on écrit à 
droite la première transformation et à gauche la seconde. S’il y 
avait plusieurs transformations, T u T 2 , T 3 par exemple, on 
écrirait T = T 3 ° T 2 ° T,. ( L’ordre est important. Si l’on dit à 
quelqu’un, pour lui préciser un itinéraire : « Tournez à gauche 
puis à droite », il parviendra en un point A ; mais si on lui dit : 
« Tournez à droite puis à gauche », il parviendra en un point B 
différent de A). 

— Propriétés du produit. 

T° P 1 = P 1 « T= p (ou /). 

Si T est involutive, T = P 1 , et on écrit : T° P 1 = P = 7° (ou /). 

Le produit de plusieurs transformations est associatif par 
définition. Mais il n’est pas nécessairement commutatif, 
comme on vient de le dire en insistant sur l’ordre des 
transformations dont on fait le produit. Si T(F) = <î> et si une 
deuxième transformation, S, transforme F et <P en F et <P' : 
S(F) = P, S(<P)= <2>', on dit que <P' est la transformée de F par 
une transformation <P' = R(F), appelée transmuée de T par S. 
On a: R = S°T°S~ A (on suppose, bien entendu, que S 1 
existe). Si S est involutive (S = S -1 ) on a R = S° T° S. 

— Groupe de transformations : si l’ensemble des trans¬ 
formations T possède la structure de groupe, on parle du 
groupe G des transformations T. Si le groupe est, en outre, 
abélien (c’est-à-dire si le produit de deux éléments de G est 
commutatif), on pourra écrire, indifféremment, T, 0 T 2 ou 
T, 

Résumé sur les transformations usuelles. 

Nous conseillons au lecteur de lire ce résumé le stylo à la 
main, et de faire, au fur et à mesure, des figures rapides pour 


illustrer les indications qui sont données, ci-dessous, dans un 
style fatalement très bref. Qu’il se reporte, toutes les fois que 
cela lui semblera nécessaire, au paragraphe précédent. 

• Translation dans le plan. 

— Définition : à tout M G E (E = plan euclidien), on fait 
correspondre par une translation de vecteur V, notée 2TV, le 
point M' G E tel que MM' = V. 

— Propriétés. 

1° Biunivoque. Pas de point double si V^O. 

2° V = 0 2T V = / (transformation identique). 

3° Le transformé d’un vecteur AB est un vecteur A' B' 
équipollent à AB 

4° Les droites de E parallèles à V sont les seules 
invariantes (globalement). 

5° La translation transforme une figure F de E en une 
figure F de E égale à F en grandeur et sens (les longueurs sont 
égales et de même sens, puisque A' B' = AB ; il en est de 
même des angles) : c’est un déplacement sans point double 
(un déplacement est une transformation qui conserve les 
longueurs et les angles, tant en grandeur qu’en sens). 

6° 2T 1 V = 2T(— V). 

7° °fV'o°rv= srvoerv’ = sr(v+ v). 

• Rotation dans le plan. 

— Définition : à tout point M du plan orienté, la rotation 
de centre O et d’angle 0 fait correspondre un point M' tel 
que : 

OM = OM' et (OM, OM') = 0(mod 2 ir) . 

Nous la noterons Rot (O, 0). 

— Propriétés. 

1° Biunivoque. Un seul point double, O, si 0 ^ 2 kir. 

2° 0 = 2 kir => Rot (O,0) = I. Dans la sui,te, nous suppo¬ 
serons 0^2 kir. 

3° Propriété caractéristique : Si T = Rot (O, 0), A' = T(A) 
et B' = T(B) sont tels que A' B' = AB et 
(AB, A B') = 0(mod2'rr). 

4° Les cercles de centre O sont globalement invariants. 

5° La rotation plane, transformant une figure F, en une 
figure F' directement égale à F, est un déplacement admettant 
un seul point double, O. 

6° Rot 1 (O,0) = Rot (O, - 0). 

7° Rot (O, 0') ° Rot (O, 0) = 

= Rot (O, 0) o Rot (O, 0') = Rot (O, 0 + 0'). 

8° Rot (O’, 0')°Rot (O, 0) = 

= Rot (O, 0) « Rot (O', 0') = Rot (o>, 0 + 0'), 
w étant le troisième sommet du triangle de base OO' et 
d’angles à la base &= - 0/2, 0^= 0' 12. 

• Antidéplacements dans le plan : symétrie axiale. 

(Un antidéplacement transforme une figure F en une 

figure F', égale à F mais non superposable à F.) 

— Définition : la symétrie axiale d’axe A, notée Sym A, 
fait correspondre à tout point M B E un point M' tel que A soit 
médiatrice de MM'. 

— Propriétés. 

1° Sym A est une transformation biunivoque et involutive 
(Sym A = Sym -1 A) dont tous les points de A sont des points 
doubles. C’est un antidéplacement. 

2° Si A' est parallèle à A, Sym A'°Sym A = ST(2 V), V. 
vecteur équipollent a AA, A et A' étant les pieds d’une 
perpendiculaire commune à A et A'. Ce produit n’est pas 
commutatif. 

3° Si A n A' = O, Sym A' ° Sym A = Rot [O, 2 (A, A')]. 

4° Réciproquement : Rot (O,0) = Sym A' ° Sym A, avec 
A arbitraire passant par O et A' déduit de A par Rot (O, 0/2). 

5° Si A il A', Sym A' ° Sym A se réduit à une symétrie par 
rapport au point O, notée Sym O. 

6° Remarque : le produit de deux symétries axiales n’est 
pas une symétrie, mais une rotation ; donc les antidéplace¬ 
ments ne forment pas un groupe. 

• Homothétie (dans le plan ou dans l’espace). 

— Définition : soit un point O et un nombre réel k ^ 0 ; 
on appelle homothétie de centre O et de rapport k la transfor¬ 
mation T telle que : 

M' = T(M) avec OM = kOM. 

On la notera Hom (O, k). Les points O, M et M' sont alignés 
(OM' et OM colinéaires). L’homothétie est dite positive si 
k > 0, négative si k < 0. 

— Cas particuliers : k = 1 =>Hom (O, k) = I ; 

k = - 1 =>Hom (O, k) = Hom (O, - 1) = Sym O. 

— Propriétés. 

1° Biunivoque ; admet O comme seul point double si 

2° Propriété, caractéristique : pour deux couples de 
points homologues (A, A') et (B, B'), on a A B' = kAB. 

3° Les droites passant par O sont globalement inva¬ 
riantes. 

4° Hom 1 (O, k) = Hom (O, "\/k). 

5° L’homothétie conserve les contacts (une droite tan¬ 
gente à une courbe au point M se transforme en une droite 
tangente à la courbe homothétique en M', homothétique de M) 
et les angles. Dans le plan, le sens des angles est conservé quel 
que soit k, positif ou négatif. 


TRANSFORMATIONS 


6° Hom (O, k’) ° Hom (O, k) = Hom (O, kk'). 
Hom (O', k') o Hom (O, k) = Hom (w, kk’), 


avec k '(1 - k ) „ 

Si kk' = 1, le produit Hom (O', k') ° Hom (O, k) est une transla¬ 
tion. 


7° L’homothétique d’un cercle de centre w et de rayon R 
est un cercle de centre w', homothétique de œ, et de rayon 
R' = kR. Les deux cercles sont dans un même plan si O est 
dans le plan du cercle donné, dans des plans parallèles dans le 
cas contraire. 

8° L’homothétique d’une sphère de rayon R est une 
sphère de rayon R' = kR, dont le centre est l’homothétique du 
centre de la sphère donnée. 

• Similitude plane. 

— Définition : on appelle similitude plane le produit 
d’une homothétie (O, k) et d’un déplacement 2) (translation ou 
rotation plane). Les figures qui se correspondent par une 
similitude sont dites semblables ; la valeur absolue du rap¬ 
port k de l’homothétie est leur rapport de similitude. 

Cas particuliers. 

1° ST Hom (0,1) = 3- V 

2° 2T V° Hom (O, k) = Hom (O', k) 
avec OO' = (~“\/k) V. 

3° Rot (O,0)o Hom (a>, 1) = Rot (O, 0). 

4° Rot (O, 2 /ctt) ° Hom (co, k) = Hom (w, k). 

Dans la suite, nous supposerons k positif et ^1, avec 
0^2 kn. 

— Propriétés. 

1° Propriété caractéristique : Si S(k, 0) désigne une 
similitude quelconque, on a : 

(AB, A B') = 0 (mod 2 tt) , 


2° S \k, 0) = S(1//c, - 0). 

3° Toute similitude S(k, 0) est décomposable d’une 
seule manière en le produit d’une homothétie Hom (O, k) et 
d’une rotation Rot (O, 0) concentriques : 

S(k, 0) = Rot (O, 0) o Hom (O, k). 

O s’appelle le centre de similitude ; c’est le seul point double 
de la similitude. 

4° Le produit de deux similitudes est une similitude oii 
une translation. 


A' = S(A), B ' = S (B ) 


• Affinité dans le plan. 

— Définition : transformation qui, à tout point M du 
plan, fait correspondre le point M' défini comme suit : 1° MM' 
est parallèle à une direction A et coupe un axe D en H ; 
2° HM = kHM. Nous noterons cette affinité A(D, A, k). Pour 
k = 1, A(D, A, k) = I ; pour k = - 1, l’affinité est involutive. 

— Propriétés. 

1° Biunivoque. 

2° Points doubles : les points de D si k / 1, tous les 
points du plan si k = 1. 

3° Si (A, A') et (6, B') sont deux couples de points 
homologues, les droites AB et A' B' sont, ou parallèles à D, ou 
concourantes sur D, ou confondues suivant une parallèle à A. 

4° A \D,A, k) = A(D, A,A/k). 

5° A(D A, k') o A(D, A, k) = A(D, A, kk') (commutatif). 
Conséquence : les affinités forment un groupe abélien. 

• Déplacements dans l’espace. 

— Rotation d’axe A et d’angle 0 : Rot (A, 0). M et M’ 
sont tous deux dans un plan perpendiculaire à zi en O et 
orienté par A. 

OM = OM' ; (OM, OM') = 0 (mod 2 tt) . 

Rot -1 (A, 0) = Rot (A, - 0). Si 0 = tt+ 2 kTr, la transformation 
s’appelle un demi-tour, ou un retournement. 

— Translation : mêmes définitions et mêmes propriétés 
que dans le plan. 

• Inversion plane. 

— Définition : étant donné un point O (pôle) et un 
nombre k (puissance), l’inversion de pôle O et de puissance k 
transforme tou t po int M du plan en un point M' de la droite OM 
tel que OM x OM' = k. Nous la noterons lnv(0, k). 

— Propriétés. 

1° Biunivoque et involutive (si on exclut le pôle). 

2° Points doubles. Si k < 0, pas de point double. Si 
k>0, tous les points du cercle de centre O et de rayon V/c, 
appelé le cercle d’inversion. 

3° lnv(0, k')<>\nv(0, k) = Hom (O, k'/k) (non commu¬ 
tatif). 

Hom (O, K) ° Inv (O, k) = Inv (O, Kk) (non commutatif). 

4° Deux couples de points inverses (A, A') et (B, B') sont 

IM 

tels que A' B' = AB q^ ' -qq 

5° Les deux expressions 

et | (CA, CB ) — (DA, DB ) | 
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6° L’inversion conserve les angles en grandeur. 

7° Inverse d’une droite passant par le pôle : elle-même. 
Inverse d’une droite ne passant pas par le pôle : cercle (C) 
passant par le pôle, dont le centre, œ, est l’inverse du 
symétrique œ' de O par rapport à la droite considérée. 

8° Inverse d’un cercle (C) ne passant pas par le pôle : 
cercle homothétique du cercle considéré dans l’homothétie 
{O, K), avec 


K = 


Puissance du point O par rapport à (C ) ' 


9° Dans l’espace : même définition, mêmes propriétés, 
mais le cercle d’inversion est remplacé par la sphère d’inver¬ 
sion. 

Généralités sur les coniques. 

Ellipse. 

• Définitions. 

— Ensemble des points M tels que MF + MF' = 2 a (F et 
F fixes, FF = 2 c < 2 a). 

— Ensemble des centres des cercles tangents à un 
cercle donné (F, 2 a) (nommé cercle directeur de l’ellipse) et 
passant par F, intérieur à ce cercle. Même définition avec le 
cercle (F, 2 a) et le point F. 

MF 

— Ensemble des points dont le rapport, -—, des dis- 

MK 

tances à un point fixe F {MF) et à une droite fixe D {MK) est 
constant et égal àe = c/a < 1. La droite D est la directrice 
associée au foyer F de l’ellipse. 

• Tangentes à l’ellipse. 

— La tangente en un point M de l’ellipse est bissectrice 
extérieure de l’angle FM F'. 

— La projection d’un foyer sur une tangente est située 
sur le cercle principal de l’ellipse (cercle de diamètre 
AA' = 2 a). 

— Le symétrique d’un foyer par rapport à une tangente 
est sur le cercle directeur relatif à l’autre foyer. 

— Une ellipse peut être considérée comme transformée 
d’un cercle par l’affinité {A, A', b/a), A étant l’axe focal et A' la 
direction perpendiculaire à A. 

Hyperbole. 

• Définitions. 

Les mêmes que pour l’ellipse, mais I MF - MF' | = 2 a (au lieu 
de MF + MF' = 2 a), FF' = 2 c > 2 a (au lieu de 2 c < 2 a), 
e = c/a > 1 (au lieu de c/a < 1). 

• Propriétés. 

Les mêmes que pour l’ellipse, mais la tangente est la 
bissectrice intérieure de l’angle des rayons vecteurs. En outre, 
les deux branches d’une hyperbole se rapprochent indéfini¬ 
ment de deux droites (qu’elles n’atteignent jamais), les asymp¬ 
totes de l’hyperbole. 


Parabole. 

• Définition : 


ensemble des points M tels que 1 

{MK : distance de M à une droite fixe appelée directrice), ou 
ensemble des centres des cercles tangents à la directrice et 
passant par F. 

• Propriétés. 

_ — La tangente en M est la bissectrice de l’angle {MF, 

MK). 

— Soient M et M’ les points de contact des tangentes 
issues de P, et Pzjd arallèle à l’axe de la parabole : 1° FP est 
bissectrice de ÆfFÏf 7 ; 2° {PM, PM') et (PF, Pz) ont même 
bissectrice {théorème de Poncelet). 


TRIGONOMETRIE. 

La mesure des angles est expliquée p. 89 ; les fonctions 
circulaires sont définies p. 90, leur variation est étudiée à la 
p. 117. 

Généralités. 

Relations entre les lignes trigonométriques 
de certains arcs. 

• Arcs supplémentaires. 

sin (tt — x ) = sin x ; 
cos (tt - x ) = - cos x ; 
tan (tt - x ) = - tan x ; 
cot (tt - x ) = - cot x . 

• Arcs opposés. 

sin ( - x ) = - sin x ; 
cos ( - x ) = cos x ; 
tan ( - x ) = - tan x ; 
cot ( - x ) = - cot x . 

• Arcs dont la différence est tt. 

sin (tt + x ) = - sin x ; 
cos (tt + x ) = - cos x ; 
tan (tt + x ) = tan x ; 
cot (tt + x ) = cot x . 


• Arcs complémentaires. 


sin 

(!-«) 

= cos x ; 

cos 

(H 

= sin x ; 

tan 

(H 

= cot x ; 

cot 

(H 

= tan x . 

• Arcs dont la différence 

est tt/2. 

sin ^ 


= cos x ; 

cos ( 

i.V ■ 

= - sin x 

tan ^ 


= - cot x 

cot ( 

i + x ) = 

= - tan x 


Relations entre les lignes trigonométriques 
d'un même arc. 

sin 2 x + cos 2 x = 1 , 
sin x 1 


tan x = 


cos x cot x ’ 


d’où : 


tan x 


Vl + tan 2 x 
1 


avec e = ± 1 . 


e Vl + tan 2 x ’ 

Lignes trigonométriques de quelques arcs 
remarquables. 

Voir le tableau au bas de la page. 

Addition , multiplication et division des arcs. 

1 - Formules d’addition. 

cos (a - b) = cos a cos b + sin a sin b , 
cos (a + b) = cos a cos b - sin a sin b , 
sin (a + b) = sin a cos b + sin b cos a , 
sin (a - P) = sin a cos b - sin b cos a, 


tan (a + b ) = 
tan (a - b ) = 


tan a + tan b 
1 - tan a tan b 
tan a - tan b 


1 + tan a tan b 

2 - Formules de multiplication par 2. 
sin 2 a = 2 sin a cos a, 

cos 2 a = cos 2 a - sin 2 a = 2 cos 2 a - 1 = 1 - 2 sin 2 a. 


tan 2 a = 


2 tan a 


1 - tan a 

3 - Expression de sin a, cos a et tan a en fonction 
tan (a/2) = t. 

2 t 


i + r’ 

1 - t 2 
cos a =- - + - 5 , 

4 - Division des arcs par 2. 

a 


., , . 2 1 
d ou tan a = -—p. 


cos 


v- 

■i-v- 


-, e =- + 1 ; 


e' = ±1 . 


Formules de transformation. 

Ces formules permettent de remplacer la somme ou la 
différence de deux fonctions circulaires par une expression 
factorielle. 

Formules générales. 

On pose a + b = p, a-b = q e t l’on démontre les formules 
suivantes : 

_ . p + q p - q 
sin p + sin q =2 sin — cos — — - , 

2sin a cos b = sin (a + b ) + sin (a - b), 

_ . p - q P + q 
sin p - sin q = 2 sin - ^ cos 2 ’ 

2 cos a sin P = sin (a + b ) - sin (a - b), 

n p + q p — q 
cos p + cos q = 2 cos — cos 2 ’ 

2 cos a cos b = cos (a + b ) + cos (a - b), 

„ . p + q q - p 
cos p - cos q = 2 sin 2 sin ~ ^- r , 

C 2sin a sin b = cos (a - b) - cos (a + P ). 

Applications. 

1 + cos a = 2 cos 2 ^ ; 1 - cos a = 2 sin 2 ^. 

_ . , A a b c 

S =sina + sinP +sinc = 4 cos — cos — cos — . 

2 2 2 

sin (p ± q) 

tan p ± tan q = -; 

cos p cos q 

sin {q ± p) 
cot p ± cot q = . . . 

sin p sin g 


1 ± tan a = V2 


sin(^±a) 


Rendre une formule calculable par logarithmes. 

Une formule est calculable par logarithmes lorsqu’elle se 
présente sous la forme d’une série de produits ou de quo¬ 
tients ; A + B, par exemple, n’est pas calculable par loga¬ 
rithmes car log (A + B) ne peut être calculé à partir de log A et 
log B. Par contre, uv est calculable par logarithmes, car 
log uv = log u + log v. Voici les méthodes les plus usuelles, 
obtenues en faisant intervenir dans les calculs des angles 
auxiliaires. 


A ± B = 


A V2 sin ± <pj 


cos (p 


Ig (A ± B ) = Ig A + ^ Ig 2 + Ig sin ^ ± + colg cos <p 

(Ig sin x signifie : logarithme du nombre sin x ; colg x = - Ig x ; 
on a posé (p tel que tan <p = B/A). 

• A + B = A(1 + cos (p) 

Ig (A + B ) = Ig 2 + Ig A + 2 Ig cos |, 


de 


avec cos <p = - 


- B = A(1 - cos (p) 

Ig (A - B ) = Ig 2 + Ig A + 2 Ig sin 


<P 
2 ' 


• x = a cos (<ot + a) + P cos {œt + /3) devient, en posant 
a sin a + p sin /3 


tan y - 


a cos a + P cos /3 
a cos a + b cos p 


cos (t ot + y ) ; 


cos y 

on peut ensuite rendre calculables par logarithmes 
acosa + Pcosp et a sin a + P sin p. 


Lignes trigonométriques de quelques arcs remarquables. 


rd 

0 

TT 

TT 

TT 

TT 

2 TT 

3 TT 

5 TT 

TT 

6 

4 

3 

2 

~3~ 

~ 4 ~ 

~ 6 ~ 

x 

degrés 

0° 

b 

CO 

4^ 

en 

b 

CO 

90° 

120° 

135° 

150° 

180° 

sin x 

o 

1 

V2 

V3 

1 

V3 

V2 

1 

o 


2 

2 

2 

2 

2 

2 


cos x 

1 

V3 

V2 

1 

Q 

1 

V2 

V3 

-1 

2 

2 

2 


2 

2 

2 

tan x 

0 

V3 

“3“ 

1 

V3 

+ 00 

- V3 

-1 

V3 

“ir 

0 

cot x 

+ 00 

V3 

1 

ICO 1 

> r 

0 

V3 

3~ 

- 1 

-V3 

— 00 
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TRIGONOMETRIE 


• y = a sin x + b cos x devient, en posant tan <p = a/b : 

b cos (x - (p ) 

y =----. 

COS (p 

Résolution des triangles. 

Dans un triangle ABC, il y a six éléments fondamentaux à 
mesurer : ses trois côtés, a, b et c, et ses trois angles, A, B et 
C, ces derniers étant tels que l’on ait : A + B + C = n. Résou¬ 
dre un triangle, c’est calculer ses éléments à partir de certaines 
données, en utilisant les propriétés géométriques élémentaires d’où 
des triangles. Selon la nature des données, on distingue 
classiquement divers cas de résolution. 

Résolution des triangles rectangles. 

Relations fondamentales : 


L’angle B satisfait à la relation 
a _ b 
sin A sin B ' 


sin B 


b sin A 
a 


L’angle C se calcule ensuite par la relation 

A + B 4- C = tt , 


C = n - (A + B). 

Le côté c se calcule enfin par la relation 


sin C sin A 


d’où : c = a 


sin C 
sin A 



— Discussion : pour que le triangle soit possible, il faut 
que c soit un réel positif et que B et C soient des quantités 
réelles positives telles que B+ C<tt. 

— Remarque : les formules de résolution auxquelles on 
•est parvenu, donnant sin B, inconnue principale, d’où l’on tire 
sin C 

C et c = a - , ne comportent que aes produits ou des 

sin A' 

quotients, elles sont donc calculables par logarithmes (ce qui 
est important pour les exemples numériques). 

Équations trigonométriques. 


b = a sin B, 
b = a cos C, 
c = a sin C, 
c = a cos B. 


( a 2 = ô 2 + c 2 , 

1 b = ctan B, 
S b = c cot C, 
f c = b tan C, 
\ c = b cot B. 


A l’aide de ces relations on pourra résoudre un triangle 
rectangle si l’on connaît (cas classiques) : 1° l’hypoténuse a et 
un angle aigu ; 2° un côté de l’angle droit et un angle aigu ; 3° 
l’hypoténuse et un côté de l’angle droit ; 4° les deux côtés de 
l’angle droit. 

Triangles quelconques. 

• Relations fondamentales. 


f a 2 = b 2 + c 2 - 2 bc cos A , 
I < b 2 = a 2 + c 2 - 2 ac cos B, 
Le 2 = a 2 +b 2 -2 ab cos C. 

! a b c 

sin A sin B sin C ’ 

A + B + C = tt . 

f a = b cos C + c cos B , 

III < b = c cos A + a cos C , 
l c = a cos B + b cos A . 



Les trois groupes contiennent chacun trois relations dis¬ 
tinctes. 

• Autres éléments du triangle : 

— Surface : S = 1/2 bc sin A. 

— Rayon R du cercle circonscrit : 

_ a _ b _ c _ abc 
2 sin A 2 sin B 2sinC 4 S 

— Rayon r du cercle inscrit : 

ABC 
r = (p -a)tan- = (p -b)tan- = (p -c)tan-, 

(p désignant le demi-périmètre). 

— Médiane AD = m : m 2 = 1/4 (b 2 + c 2 + 2 bc cos A). 

— Bissectrice intérieure de l’angle A : 

A A 
2 bc sin — cos — 

*-Hr- 

(b + c ) sin — 

• Les quatre cas classiques de résolution des triangles 
quelconques sont ceux où l’on donne : 1° un côté et deux 
angles ; 2° deux côtés et l’angle compris entre ces deux côtés ; 
3° deux côtés et l’angle opposé à l’un d’eux ; 4° les trois côtés. 

On résout ces problèmes en utilisant l’un des trois groupes 
de trois relations distinctes donnés plus haut. Le calcul 
conduit, notamment, à la résolution d’équations trigonométri¬ 
ques (voir exemple ci-dessous). 

Un exemple. 

Résoudre un triangle, connaissant les côtés a et b et l’angle 
A, opposé au côté a. 


Ce sont des équations dans lesquelles la (ou les) inconnues 
figurent dans des expressions trigonométriques. 

Équations fondamentales. 

— Équation sin x = a : Soit a un arc quelconque ayant 
pour sinus le nombre a : sin a = a ; les arcs x solutions de 
l’équation sin x = a sont donnés par les deux relations sui¬ 
vantes : 

X = a + 2 kTT et X = (tt — a) + 2 kn. 

(Dans la pratique, on pourra prendre a compris entre 0 et 90°, 
par exemple). 

— Équation cos x = b : Soit /3 un arc quelconque tel 
que cos /3 = b ; on aura les solutions 

x = (3 + 2 kn et x = - (3 + 2 kn . 

— Équation tan x = c : Soit y un angle dont la tangente 
est c, tan y = c ; on aura les solutions 

x = y + kTT . 

Méthode générale de résolution des équations 
trigonométriques. 

On leur fait subir un certain nombre de transformations 
aboutissant, soit à une équation algébrique, soit à une équa¬ 
tion trigonométrique fondamentale, voici quelques exemples. 

— Résoudre : cos x(2 sin x - 1) = 0. Cette équation se 
décompose en deux : 

cos x = 0 et 2 sin x-1=0, d’où sin x = 1/2; 

cos x = 0 est vérifiée par les arcs x = tt/ 2 + 2 kn et 
x = - tt/2 + 2 kTT ; d’autre part, on a, avec a = Tr/6/sin a = 1/2, 
d’où : 

x = ~ T 2 k tt et x = (tt - ^ ) +2 kTT. 

Au total, les solutions de l’équation proposée sont donc : 

x = ±| + 2^, x=| + 2 fc„, x=|? + 2 fc„. 

— Résoudre : cos x — sin (x/2) = m. On exprime cos x 
en fonction de sin (x/2) : cos x = 1 - 2 sin 2 (x/2), et l’on aboutit 
à l’équation résolvante : 

2sin 2 ^ +sin^ + m -1=0. 

Posons sin (x/2) = z ; on est amené à résoudre l’équation du 
second degré 

2z 2 + z+ m~^ =0. 

On discute cette équation en imposant à son discriminant, 
A = 9,-8 m, d’être positif ou nul (pour que les racines soient 
réelles), et à ses racines, z' et z", d’être comprises entre - 1 et 
+ 1, puisque z = sin (x/2) est, en valeur absolue, inférieur à 
l’unité. 

Si m est tel que z' convienne et si a est un angle tel que 
sin a = z', on aura x/2 = a + 2 kn et x/2 = (tt- a) + 2 kn, d’où 
les solutions x = 2 a + 4 kn et X = 2 (tt - a) + 4 kTT. 

— Résoudre : a sin x + b cos x = c. On remplace sin x 
et cos x par leurs expressions respectives en fonction de 
tan (x/2) = t, et l’on aboutit à l’équation algébrique suivante en 

(b + c)t z — 2at+c—b = 0. 

Si t' est une racine de cette équation, on peut écrire : 
tan a = f , d’où -î = a + kn et x = 2 a + 2 kTT. 

— Autre méthode : on pose tan <p = b /a et l’on trans¬ 
forme l’équation, qui devient sin (x + <p) = (c/a) cos <p. Soit 
alors a un arc dont le sinus est égal à (c/a) cos (p , on aura : 

X + (p = a + 2 kTT et x + (p = (n - a) + 2 kn . 

— Résoudre : a tan x + b cot x = c. On peut remplacer 

cotx par ——et l’on obtient l’équation 
tan x 

a tan 2 x - c tan x + b = 0 , 


qu’on résout comme une équation du second degré en posant 

z = tan x. On peut aussi remplacer tan x par sm x et cot x par 

cos x 

COS X , ce qui donne, après calculs, 
sin x 


c sin 2 x + (a - b) cos 2 x = a + b, 
équation de la forme A sin z + B cos z = C (voir ci-dessus). 

Inversion des fonctions circulaires. 

Généralités. 

Nous prendrons l’exemple de l’inversion de la tangente, mais 
nos observations s’adaptent, tout aussi bien, à l’inversion du 
sinus, du cosinus ou de la cotangente. 

Soit l’équation tan y = V3 ; elle définit tout arc y dont la 
tangente est égale à V3. En consistant le tableau des valeurs 
remarquables des fonctions circulaires (voir ci-contre p. 148), 
nous voyons que tan (jt/3) = V~3 ; nous pouvons donc écrire 
que tous les arcs y vérifiant la relation y = (jt/3) = kn sont 
solutions de l’équation tan y = V~3. Nous écrirons : y = 
arctan V~3 (lire « arc tangente V~3 »), pour désigner l’un 
quelconque des arcs y = (jt/3) + kn. Considérons maintenant 
une variable x et la relation tan y = x; un arc y quelconque 
dont la tangente est égale à x s’écrira, de même, y = arctan x. 
L’arc y est une fonction de x, appelée fonction circulaire 
inverse (ou, ici, fonction tangente inverse) ; elle est multi¬ 
forme, car, à une valeur de x correspond une infinité de 
valeurs de y. 

Si la fonction arctan x prend une valeur déterminée Dour une 
valeur donnée de x dans un intervalle [a, b], c’est ce qu’on 
appelle une détermination de arctan x. Quand x décrit l’inter¬ 
valle [a, b], cette détermination de arctan x décrit générale¬ 
ment par continuité un intervalle [y a , y b ]. 

On appelle détermination principale de la fonction arctan x 
la détermination qui s’annule avec x, c’est-à-dire telle que 
arctan 0 = 0. On la désigne par Arctan x (avec un A majus¬ 
cule) ; quand x croît de - » à + <», Arctan x croît de - n/2 à 
+ tt/2, et l’on a toujours : 

arctan x = Arctan x + kTT (k : entier quelconque). 

Relations. 

• y = arcsin x. Pour x6[- tt/2, tt/2] on pose 
y = Arcsin x, définie pour I x I 1 ; on a : 

arcsin x = Arcsin x + 2 kn ou tt - Arcsin x + 2 kn. 

• y = arecos x. Pour x G [0, n], on pose y = Arccos x, 
définie pour I x I ^ 1 ; on a : 

arccos x = ± Arccos x + 2 kn 


et 

Arcsin x + Arccos x =-~ ■ 

• y = arctan x. On pose, pour xe]-», + <»[, 

y = Arctan x. On a : 

arctan x = Arctan x + kn. 

— Quelques relations remarquables. 

• Arctan x + Arctan (1 /x) = e(n/2), pour ex > 0. 

• Arctan a + Arctan b = Arctan (a + b)/( 1 - ab) si, et 
seulement si, ab ^ 1. 


PRINCIPAUX RÉSULTATS 
DE LA GÉOMÉTRIE ANALYTIQUE. 


Voir les définitions relatives aux coordonnées d’un point 
pp. 93-94 et pp. 96-99 : La géométrie affine de la droite et du 
plan. 

Propriétés métriques de la droite et du plan. 

Dans tout ce qui suit, nous supposons l’espace rapporté à un 
repère euclidien (orthonormé). Les vecteurs unitaires des axes 
Ox, Oy et’Oz du trièdre de référence sont respectivement /,/, 
k. Dans le plan rapporté, de même, à un repère euclidien, nous 
prendrons deux axes rectangulaires Ox et Oy, avec / et 
/comme vecteurs unitaires. 

Équation du plan. 

• Soit le plan P d’équation Ax + By + Cz + D = 0 (voir 

p. 101). 

— Le vecteur G(A, B, C) est perpendiculaire à P; ses 
coordonnées sont les dérivées partielles, P' x , P’, P' z , de la 
fonction P(x, y, z) = Ax+ By+ Cz + D. On dit que G est le 
gradient de la fonction de point P(x, y, z) ou, par abus de 
langage, que G est un gradient du plan P. 

— Angle de deux plans = angle de leurs gradients. 

— Plan passant par M 0 (x 0 , y 0 , z 0 ) et perpendiculaire à la 
droite D de paramètres directeurs (voir p. 97) a, b, c : 
a(x - x 0 ) + b(y - y 0 ) + c(z - z 0 ) = 0. 

— Condition d’orthogonalité de deux plans P et P : 
AA' -t- BB' + CC' = 0 (orthogonalité de leurs gradients). 

• Équation normale du plan. 

— Distance algébrique du point M 0 (x 0 , y 0 , z 0 ) au plan 
P = Ax + By + Cz + D = 0 (comptée algébriquement, à partir 
de la projection H de M 0 sur le plan, sur l’axe orienté par G) : 
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GÉOMÉTRIE ANALYTIQUE 


^ _ Axp + By 0 4 Cz o 4- D 
VA*+ B*+ C* 

— En appelant a, (3, y, les angles de Ox, Oye t Ozavec G 
et p la distance algébrique OKde l’origine O au plan P, on a 

D 

P VA* + B 2 + C 2 ’ 

Véquation normale du plan est 

x cos a + y cos (3 + z cos y - p = 0 . 

La droite en géométrie plane. 

• Soit D une droite d’équation 

D(x, y) = Ax + By + C = 0 . 

— Le vecteur G{A, B) est perpendiculaire à D; ses 
coordonnées sont D;, D; (dérivées partielles) : G est le gra- 
dient de la fonction de point D(x, y). Par abus de langage, on 
dit : G est un gradient de la droite D. 

— Équation de la droite passant par M 0 (x 0 , y 0 ) et 
perpendiculaire à D: 

x - xp y - y 0 

A B 

— Condition d’orthogonalité de D(Ax+ 8y + C = 0) et 
D'(A' x + B' y+ C' = 0) : AA' + BB' = 0. 

• Équation normale de la droite. 

— Distance algébrique du point M 0 (x 0 , y 0 ) à la droite 
D= Ax+ By+ C = 0. Avec les mêmes conventions que pour le 
plan (voir a) : 

, _ Ax o + By o T C 

Va 2 + b 2 

— Avec (Ox, G) = 0 (mod. 2 tt) et p= UK (distance de 
l’origine à la droite, comptée algébriquement sur l’axe orienté 
par G), \’équation normale de la droite est 

x cos 0 + y sin 0 - p = 0 . 

Ainsi, p et 0 sont les coordonnées polaires de K dans le 
système de pôle O et d’axe Ox. 

• La droite en coordonnées polaires. 

— Soit M(r, 0). Si la droite ne passe pas par O, son 
équation polaire est : 

— = a cos 0 + b sin 0 (a = 0 , D // Ox ; b = 0 , D J_ Ox ). 
Si la droite passe par O, l’équation se réduit à 0 = 0 O . 

La droite dans l'espace. 

Équations de la droite D passant par M 0 (x 0 , y 0 , z 0 ) et perpen¬ 
diculaire à P = Ax + By + Cz + D = 0 : 

x ~ x 0 _ y — y o _ z -zp 

A B C 

Éléments à l'infini. Éléments imaginaires 
(Repère affine ou euclidien). 

Coordonnées homogènes. 

— Une ligne du plan xOy est dite algébrique s’il existe, 
entre les coordonnées x et y de ses points, une relation 
algébrique de la forme f(x, y) = 0. De même, une surface est 
dite algébrique s’il existe, entre les coordonnées de ses points, 
une relation algébrique f(x, y, z) = 0 ; f est un polynôme du 
degré n (n est appelé l’ordre de la surface). 

— Soit M de coordonnées (x, y, z). On peut définir 
quatre nombres X, Y, Z et T par les équations x = X/T, 
y = Y/T, z = Z/T-, on les appelle les coordonnées homogènes 
de M. Elles vont nous servir à définir les éléments à l’infini et 
les éléments imaginaires. 

Éléments à l'infini. 

— Considérons la droite D, de paramètres directeurs 
a, b, c. Ses équations paramétriques sont (p. 100) : 
x = x 0 + ap, y = y 0 + bp, z = z 0 + cp. 

A ces coordonnées cartésiennes correspondent les coor¬ 
données homogènes : 

x _ Xo + ap y _ y 0 + bp z _ z 0 + cp T = /\_ 

P p P P 

Si le point M s’éloigne à l’infini sur la droite D, ses coordon¬ 
nées homogènes tendent vers (a, b, c, 0). Par définition, elles 
définissent le point à l’infini sur D. Deux droites parallèles D et 
D', de paramètres directeurs communs a, b et c, ont donc 
même point à l’infini : (a, b, c, 0). 

— De même, l’équation homogène d’un plan est 
AX + BY + CZ + DT = 0 ; lorsque A, B, C sont nuis sans que D 
le soit, cette équation se réduit à T = 0 : par définition, c’est 
l’équation du plan de l’infini (auquel appartiennent tous les 
points à l’infini). 

— De même, les équations : 

AX + BY + CZ + DT = 0 et T = 0 (A 2 + B 2 + C 2 ¥ 0) 

représentent, par définition, la droite de l’infini du plan 
AX+BY+CZ+DT = 0. 


— Intérêt de ces notions : point à l’infini, droite à l’infini, 
plan de l’infini ne désignent pas des réalités représentables 
concrètement ; ce sont des notions algébriques, permettant de 
généraliser les calculs. L’espace « ordinaire >> (affine ou eucli¬ 
dien), complété par ces éléments à l’infini, s’appelle I espace 
arguésien (en l’honneur du mathématicien Desargues). Dans 
cet espace, si deux plans ne sont pas confondus, ils ont en 
commun une droite et une seule (s’ils sont parallèles, cette 
droite est à l’infini ; s’ils ne sont pas parallèles, c’est leur 
intersection « ordinaire »). 

Éléments imaginaires. 

— Convenons d’appeler « point imaginaire » un ensem¬ 
ble de quatre nombres complexes : 

X = Ai + iA 2> Y = B^ + \B 2 , Z = Cf + iC 2 , T = Df + i D 2 , 

ces nombres étant appelés les coordonnées homogènes du 
point qu’ils définissent ; si T = 0, le point imaginaire sera dit à 
l’infini. 

— Nous appellerons plan l’ensemble des points, au 
sens précédent, vérifiant l’équation AX + BY + CZ + DT = 0, et 
droite l’ensemble des points vérifiant deux équations distinc¬ 
tes de cette forme. 

— Le cas particulier A 2 = B 2 = C 2 = D 2 = 0 nous fait 
retrouver l’espace arguésien réel. L’intérêt de l’espace argué¬ 
sien imaginaire est, évidemment, sa généralité. Par exemple, 
nous verrons que l’équation cartésienne du cercle de centre 
(a, b) et de rayon R est x 2 + y 2 - 2 ax - 2 by + c = 0, avec 
R 2 = a 2 + b 2 - c ; mais nous devons poser a 2 + b 2 > c (sinon, 
a 2 + b 2 - c serait négatif et, R 2 étant essentiellement positif, 
l’égalité serait impossible avec les réels). Avec des éléments 
imaginaires, la restriction a 2 + b 2 > c ne s’impose plus et l’on 
peut dire que l’équation en cause représente toujours un 
cercle, réel ou imaginaire. 

Éléments isotropes (repère euclidien). 

Soient deux points M,(Xf, y,, z/) et M 2 {x 2 , y 2 , z 2 ). Leur 
distance d est telle que 

d 2 = Mf M 2 = (x 2 - x A ) 2 + (y 2 - y/) 2 + (z 2 - z/) 2 , 

les quantités x 2 - x,, y 2 - y A et z 2 - z, formant un système (a, b , 
c) de paramètres directeurs de la droite M , M 2 . En géométrie 
réelle, pour que la distance d soit nulle, il faut et il suffit que 
x 2 = Xf, y 2 = y,, z 2 = z 1 et M 2 confondus), car la somme de 
trois carrés ne peut être nulle que si ces carrés sont tous nuis. 
En géométrie imaginaire, ce n’est plus une condition valable, 
car un carré peut être négatif. D’où une définition nouvelle de 
la distance nulle : pour que la distance de deux points M, et M 2 
soit nulle, il faut et il suffit que à 2 + b 2 + c 2 = 0, a, b et c étant 
des paramètres directeurs de la droite M^ M 2 . Une telle droite 
est dite isotrope. Par chaque point imaginaire du plan passent 
deux droites isotropes, de pentes + i et - i ; par chaque point 
de l’espace passent une infinité de droites isotropes, formant 
un cône isotrope. 

Dans le plan xOy, les points à l’infini des droites isotropes de 
ce plan ont pour coordonnées homogènes (1, i, 0) et (1, - i, 0) : 
ce sont les points cycliques du plan. 

Propriétés générales des courbes 
et des surfaces. 

(Repère euclidien ; tout ce qui suit concerne la géométrie 
réelle). 

Courbes planes d'équation y = f(x) admettant une 
dérivée y' = f' (x). 

— Soit M(x, y) un point de la courbe ; on a : 


Pente Équation 


Tangente en M 

y' 

Y -y = y' (X -x) 

Normale en M 

1 

y' 

X -x +y'(Y - y ) = 0 

Sous-tangente 

PT= - — 

y 


Sous-normale 

PN - yy' 




— Quand la dérivée seconde y" s’annule en changeant 
de signe, la concavité de la courbe change de sens ; le zéro de 
y" est l’abscisse d’un point d’inflexion. 

— Si, quand x -* ± », y-> a, la droite y = a est asymp¬ 
tote à la courbe (qui se rapproche d’elle indéfiniment sans 
jamais la couper). Si, quand x—> b, y —> ± oo, la droite x = b est 
asymptote à la courbe. Quand x et y tendent en même temps 


vers l’infini, si y —> ex + d, la droite y = ex + d est une asymp¬ 
tote oblique. 

Courbes planes définies par deux équations 
paramétriques. 

— La courbe est représentée par x = f(t) et y= g(t). 

— Équation de la tangente en M 0 (t 0 ) : 

X - f(to) y -g(t o) 
f'(to) g'(to) ' 

— Équation de la normale en M 0 (t 0 ) : 

[x - f(t 0 )] f(t 0 ) + [y - g(t Q )] g'(t 0 ) = 0. 

— Si, par un point, il passe plusieurs branches de la 
courbe, ce point est dit multiple. Les points doubles s’obtien¬ 
nent en cherchant les couples de valeurs (f 1? t 2 ) de t tels qu’on 
ait à la fois f{t/) = f(t 2 ) et g(t,) = g(t 2 ). 

— Si une courbe est donnée par son équation en 
coordonnées polaires, p = f(0), on a immédiatement la repré¬ 
sentation paramétrique 

x=f(0)cos 0, y=f(0)sin0. 

Courbes planes définies par une équation implicite 

flx, y) = 0. 

— Tangente en /W 0 (x 0 , y 0 ) : 

(X - x 0 ) f; 0 + (y - y„) f'y 0 = o . 

— Si f' Q = f/ = 0, M 0 est un point singulier. 

Géométrie dans l'espace. 

1° La courbe définie par x = f(t), y - g(t), z = h(t) est 
plane si, et seulement si, on peut déterminer des constantes A, 
B, C, D, telles que Af(t) + Bg(t) + Ch(t) + D = 0 ; sinon, la 
courbe est gauche. 

2° Tangente en M 0 : 

x - f (t 0 ) = y - g(t 0 ) = z - h(t 0 ) 

f\t o) g’(to) h'(to) ■ 

3° Si, en M 0 , f’(t 0 ), g’{t 0 ), h’(t 0 ) ne sont pas nuis en même 
temps, le plan défini par la tangente en M 0 à la courbe et un 
point M voisin de M 0 tend vers une position limite quand 
M —*■ M 0 -, cette position limite s’appelle le plan osculateur de la 
courbe au point M 0 . 

4° Surface z = f(x, y). On suppose f continue et dériva¬ 
ble par rapport à l’ensemble des variables. 

• Plan tangent à z = f(x, y) en un point M 0 (x 0 , y 0 ) : 

Z — Z 0 = p 0 {x - x 0 ) + q 0 (y - y 0 ), 
avec p 0 = f’Xx o, y 0 ) et q 0 = f;(x 0 , y 0 ). 

• Normale en M 0 : 

x - xp = y - y 0 = z - zp 

p o q o — 1 


Lieux géométriques. 

Un lieu géométrique est un ensemble de points caractérisés 
par une propriété géométrique commune. La recherche d’un 
lieu géométrique consiste, en géométrie analytique, à détermi¬ 
ner l’équation ou les équations de ce lieu, qui peut être une 
ligne, une surface, etc. 

Recherche de l'équation cartésienne du lieu. 

1° On définit le repère (affine ou euclidien, plan ou à 
trois dimensions, etc.). 

2° On appelle x et y (ou x, y et z) les coordonnées d’un 
point M quelconque et on exprime, en se servant des données 
du problème, la condition nécessaire et suffisante pour que M 
appartienne au lieu. 

3° On obtient l’équation du lieu. 

Exemple : le point A est fixe sur un cercle de diamètre 
a ; on considère une corde AP variable du cercle et l’on porte 
sur AP une longueur PM = b. Quel est le lieu de M quand P 
décrit le cercle ? 

— On prend un système de coordonnées polaires, d’axe 
Ax passant par le centre du cercle. 

— Les coordonnées d’un point M du lieu sont (p, 0), 
telles que 0 = (Ax, AP) et p = AM. On a AP = a cos 0 et 
AM = p = a cos 0 + b ; c’est l’équation cherchée (la courbe 
obtenue s’appelle un limaçon de Pascal). 

Représentation paramétrique. 

La recherche des équations paramétriques simplifie souvent 
les calculs ; on peut retrouver ensuite l’équation cartésienne 
en éliminant le paramètre. 


y 



150 












































Exemple : Représentation paramétrique de la cydoïde 
(courbe décrite par un point M d’un cercle roulant sans 
glissement sur une droite ; voir figure au bas de la colonne 
précédente). 

Le cercle roulant sans glisser sur Ox, le point M qui se 
trouvait en O à l’instant initial occupe, lorsque le point de 
contact du cercle avec Ox est venu en /, une position telle que 
arc IM = longueur Ol. 

Posons ( (oM, col) = t et projetons sur les axes l’égalité 
vectorielle : 

OM = OI+ l(D+(i)M. 

On trouve, comme expressions des coordonnées x et y de M 
en fonction de t : 

x = R( t - sin t) , y = R( 1 - cos t). 

Utilisation des transformations. 

Au point M(x, y, z) de l’espace nous faisons correspondre 
son transformé de coordonnées x, = f(x, y, z), 

y, = g(x, y, z), z, = h(x, y, z). Si M appartient à une figure F 
dont on connaît l’équation, M, appartient à une figure F n dont 
l’équation peut se déduire de celle de F. L’intérêt pratique des 
transformations, en géométrie analytique, est le suivant : pour 
chercher le lieu d’un point M, on a parfois avantage à 
transformer M en M , et à chercher le lieu de M u dont 
l’équation est plus simple ; on repasse ensuite de l’équation du 
lieu de M n à celle du lieu de M. 

Corrélation en géométrie plane. 

Tangente et enveloppes. 

Courbes corrélatives (coordonnées homogènes). 

— Soit la droite D = AX + BY + CT = 0 ; associons-lui 
le point P de coordonnées homogènes (A, B, C) : on dit que le 
point et la droite considérés sont corrélatifs. Plus générale¬ 
ment, étant donné une courbe C et une tangente variable D à 
cette courbe, appelons r la courbe lieu du point P corrélatif de 
la droite D : les courbes C et T sont dites corrélatives. 

— Théorème : Si la droite D varie en passant par un 
point fixe A, le corrélatif P de la droite D décrit la droite A, 
corrélative du point A. 

— Soit une courbe algébrique f(X, Y, T) = 0 ; la condi¬ 
tion pour qu’une droite AX + BY + CT = 0 soit tangente à la 
courbe s’obtient en écrivant que l’équation de la droite est 
identique à l’équation, Xf* -t- Yfÿ + Tfj = 0, de la tangente à la 
courbe au point (X, Y, T). On obtient donc : 

AX + BY + CT = 0 et -£■ = ; 

fx f y f'r 

en éliminant X, Y et T entre ces équations, on obtient une 
relation algébrique cp(A, B, C) = 0 qui est l 'équation tangen- 
tielle de la courbe. On montre que cette équation est l’équation 
de la corrélative à la courbe considérée et réciproquement. Le 
degré de l’équation tangentielle est la classe de la courbe 
considérée. Une courbe de première classe possède une 
équation tangentielle du premier degré, aA + bB + cC = 0, ce 
qui revient à dire que la droite AX + BY + CT = 0 passe par le 
point (a, b, c) ; donc, si une courbe est de première classe, 
cette courbe est un point. 

Enveloppes (coordonnées non homogènes). 

Soit une famille de courbes, C 1p C 2 , ... dépendant d’un 
paramètre A et définies par l’équation f(x, y, A) = 0. S’il existe 
une courbe E tangente à toutes les courbes de cette famille, E 
s’appelle l'enveloppe des courbes f(x, y, A) = 0. On démontre 
le théorème suivant : 

S’il existe une enveloppe E, telle que, pour un arc considéré 
de E au voisinage du point M(x, y), les dérivées partielles f x et 
^'demeurent finies et continues, cette enveloppe appartient au 
lieu des points de rencontre des deux courbes 

f(x, y, A) = 0 et f k (x, y, A) = 0 . 

Inversement, toute courbe définie par le système précédent 
est, soit une enveloppe de courbes f(x, y, A) = 0, soit un lieu de 
points singuliers des lignes f(x, y, A) = 0, soit une courbe 
« stationnaire » de la famille. 


Courbure. 

Longueur d'un arc. 

Soit la courbe x= f(t), y = g(t), z= h(t) et un arc M 0 M 
correspondant à la variation t - t 0 du paramètre ; on démontre 
que, s désignant l’abscisse curviligne de M (c’est-à-dire la 
longueur de l’arc OM, O étant une origine sur la courbe), on a : 

ds 2 = dx 2 + dy 2 + dz 2 
et 

M 0 M = ± f‘ V f ,2 (t) + g ,2 (t) + h ,2 (t)dt. 

0 

Centre et rayon de courbure. 

Soit une courbe C et la tangente MT en M à cette courbe, 
que nous orientons selon l’axe T'T. Considérons, d’autre 
part, une sphère de centre O et de rayon égal à l’unité. Le rayon 
Ou parallèle à MT, /x étant sur la sphère, varie avec la direction 
(positive) de MT ; à des points M,, M z , M 3 , ... correspondent 
des points /i„ p, 2 , /x 3 , ... sur la sphère et des rayons 0/x„ Op, 2 , 


GÉOMÉTRIE ANALYTIQUE 


0/x 3 ,... Le lieu du point /x est une courbe, tracée sur la sphère, 
et qu’on appelle Vindicatrice sphérique de la courbe C; la 
droite O/x engendre un cône de sommet O, le cône des 
tangentes à C. On a : 

O/x normal à la sphère tangente en /x à l’indicatrice parallèle 
à la normale principale en M à la courbe C. 

Soient deux points M et M', d’abscisses curvilignes s et s' 
sur C ; soit cr et & les abscisses curvilignes de \x et fx' sur 
l’indicatrice. Quand M 'tend vers M, il en est de même pour /x 
et fx' ; s' - s —*■ ds, & — cr —* dcr et l’on appelle rayon de cour¬ 
bure de C au point M le quotient différentiel ds/dcr= R. Le 
point (o de la normale MN, tel que Mœ = R, s’appelle le centre 
de courbure en M. 

— Calcul du rayon de courbure : Si l’on connaît les 
coordonnées x, y, z de M en fonction de l’abscisse curviligne s 
de M, on a : 



Si x, y et z sont connus en fonction d’un paramètre t, on a : 

1 A 2 + B 2 + C 2 
-R* ~ x ’ 2 + y ,z + z ' 2 ’ 

avec 

A=yz"-z'y", B = z’x"-x'z", C = x'y" - y' x". 


— Cas d’une courbe plane. L’indicatrice se compose 
alors d’arcs du grand cercle de la sphère de centre O et de 
rayon unité contenu dans le plan xOy de la courbe. On a alors 
intérêt à poser <p = (Ox, MT) = (Ox, O/x) et à calculer le rayon 
de courbure en utilisant les formules 


COS (p 


dx 
ds ’ 


sin (p = 


dy 
ds ’ 


R 


ds 

d <p 


Courbes du second ordre (coniques). 

Une courbe du second ordre est une courbe dont l’équation 
est du second degré par rapport aux coordonnées (homogènes 
ou cartésiennes). On démontre qu’une équation quelconque 
du second ordre représente une ellipse, une hyperbole, une 
parabole ou un système de deux droites, selon les cas (un 
cercle est une ellipse dont les foyers sont confondus au centre 
O de la courbe). 

Coordonnées homogènes (X, Y, T). 

L’équation d’une courbe du second ordre est : 
f(X, Y, T) = AX 2 + BY 2 + CT 2 + 2 DYT + 2 EXT + 2 FXY = 0 . 
— Si les trois droites 

^ f x = AX + FY + ET = 0 , 

^ f V = FX + BY + DT = 0, 

^ f ' T = EX + DY + CT = 0 

sont concourantes (la courbe admet un point d’ordre deux), la 
courbe est décomposée (en deux droites distinctes). Si les trois 
droites sont confondues, la courbe se réduit à une droite 
double confondue avec elles. 

Coordonnées cartésiennes (x, y). 

L’équation est de la forme : 

f(x, y) = Ax 2 + 2 Bxy + Cy 2 + 2Dx + 2Ey+F=0. 

(Les coefficients ne sont pas égaux, en général, aux coeffi¬ 
cients de l’équation en coordonnées homogènes ; nous les 
supposerons, en outre, tous réels.) 

1° Points à l’infini. 

• B 2 - AC < 0 : tous les points (réels) de la courbe sont 
à distance finie (pas de direction asymptotique réelle). 

• B 2 - AC > 0 : deux directions asymptotiques réelles et 
distinctes. 

2° Nature géométrique d’une courbe du second ordre. 

• B 2 - AC = 0 : la courbe est une parabole. Un change¬ 
ment convenable d’axes permet d’écrire l’équation sous la 
forme explicite Y 2 = 2 pX. 

• B 2 - AC 0 : la courbe possède un centre de symétrie 
et un seul. Si a et /S sont les coordonnées du centre, la 
translation des axes x = a + X, y = (3 + Y permet d’écrire 
l’équation sous la forme 

AX 2 + 2BXY+CY 2 = t . 

Les directions asymptotiques ont pour équation : 

(p(x, y) = Ax 2 + 2 Bxy + Cy 2 = 0 ; 
leurs bissectrices sont les deux droites réelles rectangulaires 
By 2 + (A - C) xy- Bx 2 = 0 . 

Avec ces bissectrices comme axes, l’équation 
AX 2 + 2BXY+CY 2 = 1 

devient \x 2 + /x y 2 = 1. Dès lors, deux cas sont possibles : 

1 0r cas : A et fx ont des signes contraires (par exemple A > 0 
et ix < 0) ; les asymptotes sont réelles et la courbe est une 
hyperbole. En posant A = 1/a 2 , /x = - t/b 2 , son équation est : 



2 e cas : À et /x sont de même signe ; les asymptotes sont 
imaginaires et la courbe est une ellipse. Si A et /x sont négatifs, 
c’est une ellipse imaginaire ; si A et /x sont positifs, on peut 
poser A = 1/a 2 et /x — t/b 2 , et l’équation de l’ellipse (réelle) 
est : 


x 


2 




= 1 . 


Résumé sur les trois coniques. 

La parabole, l’ellipse et l’ hyperbole sont des courbes obte¬ 
nues en coupant un cône de révolution par un plan ; on les 
appelle, pour cette raison, des coniques. Voir les figures 
ci-dessous. 

— Parabole : y 2 = 2 px (lieu des points M tels que 
MF = MK). 

OA = OF = | ; FM = | + x (F : foyer) ; HN = p ; HT = 2 x . 

Équation polaire : p = -- - —- : (p rayon vecteur FM du 

1 — cos 0 

point M ). 



x v 

— Ellipse: — + -- = 1 (lieu des points M tels que 
MF + MF' = 2 a). 

ÔA = a, ÔB = b, ÔF = c ; b 2 = a 2 - c 2 . 

I x = a cos (p, . _ __ 

| y = b sin <P = (Ox,OP). 

ex 
a ’ 

P 


FM = a 
Équation polaire : p = 


r-, .. C* 

F' M = a + — . 


1 + e cos ( 


p= T ; e 


-< 1 , p = FM , 6 = (Fx, FM). 



X 2 V 

— Hyperbole: —;-■£=-= 1. Lieu des points M tels 
a 2 b 

que I MF' - MF I = 2 a. 

OÀ = - OÂ' = a , ÔF = -ÔF' = C , b 2 = c 2 -a 2 . 


e == ~ > 1- Si a = ô, e = V2 (hyperbole équilatère). 

b b 

tg<p = — ; équation des asymptotes y = ± — x . 
a a 

cx ex 

FM = -a , F M =-h a . 

a a 
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COURBES USUELLES 


Équation polaire : p = ----, avec 

y 1 + e cos 0 

b 2 c 

P = — , e= —>1, P = FM , 0=(Fx, FM). 



Normales aux coniques. 


— Ellipse 


I x = a cos (p , 
j y = b sin <p . 


Normale en M(<p) : ■ - — - - c 2 = 0. 

eut» (p sin (p 

Equation de la développée (lieu des centres de courbure) : 

(aX) 2/3 + ( bY ) 2/3 = c 213 ; 
c’est aussi l’enveloppe de la droite 


X sin (p 


Y cos (p = — sin (p cos <p 


qui se déplace de telle sorte que la distance de ses points 
d’intersection avec les axes demeure constante. 

— Hyperbole : on obtient les mêmes résultats que pour 
l’ellipse, en changeant b 2 en - b 2 . 

— Parabole : normale au point (x, y) : 

yX + pY - y(x + p) = 0. 

Développée de la parabole : 

8(p — X) 3 + 27 pY 2 = 0 


(courbe du 3 e ordre). 


Équation du cercle. 

Le cercle est une ellipse d’excentricité nulle (c = 0). 

— Origine au centre co du cercle : x 2 + y 2 = R 2 . 

— Origine distincte de co, de coordonnées (a, p) : 

(x-*) 2 + (y-p) 2 =R 2 , 
soit : x 2 + y 2 + 2 Dx + 2 Ey + F = 0, avec 

D = - a, E = - p, F = a 2 + p 2 - R 2 . 

L’équation du cercle s’obtient donc en faisant A = C = 1 et 
B = 0 dans l’équation générale d’une courbe du second ordre. 
A partir de cette équation, on a immédiatement : 

a = -D, p = -E, R 2 =D 2 +E 2 - F. 

Quelques courbes usuelles. 

Voir planche ci-contre. 



O 0 

q' = sl sec “ - 
courbe de Gauss. 



y= e * 


cycloïde 





y 



y\2 a X) x 


chaînette 



caraioide 


if 



(x 2 + y 2 ) 2 + 4 ax(x 2 + y 2 ) = 4 a 2 y 



y - In 4 


conchoïde d 

e Nicomède 

b 


| - 

b 2 x 2 = (x - 

a) 2 (x 2 + ,y 2 ) 


strophe 

1 

jïde 

( . 


\ X 

Ht X 

! - X 


hypocycloïde à 4 rebroussements 



courbe exponentiellè 



y - e x 


. folium de Descartes 



limaçon de Pascal 



lemniacate de Bernoulli' 



(x 2 + y 2 ) 2 + a 2 (x 2 - y 2 ) 


Allure de quelques courbes usuelles. 


Surfaces du second ordre , ou quadriques. 

Généralités. 

— Une surface du second ordre, ou quadrique, a pour 
équation, en coordonnées homogènes : 

f(x, y, z, t) = Ax 2 + By 2 + Cz 2 + 2 Dyz + 

+ 2Ezx + 2Fxy + 2 t(Gx + Hy + Iz) + Jf = 0 . 

Si elle admet un point, et un seul, d’ordre 2, c’est un cône et 
elle est développable (condition nécessaire et suffisante). Cette 
condition équivaut au fait que les quatre plans d’équations 
1111 

— f ' = 0, — f ' = 0, — f' = 0, — f,' = 0 ont -un point commun et un 
2 2 2 2 
seul. 

— Pour classer les quadriques, on considère le cône 
<p(x, y, z) = Ax 2 + By 2 + Cz 2 + 2 Dyz + 2 Ezx 4- 2 Fxy = 0 , 

appelé cône directeur de la surface. L’intersection de ce cône 
avec le plan de l’infini est une conique à l’infini, représentée 
par : 

<p(x, y, z) = 0 et t = 0 . 

Selon la nature de cette conique, on distinguera diverses 
classes de quadriques. 

— Signalons que, si une surface a deux points d’ordre 
deux, elle se décompose en deux plans ; si ces deux plans sont 
confondus, la quadrique se réduit à un plan double. 

Classification des quadriques. 

• Si la conique à l’infini se décompose, elle peut se 
réduire (voir p. 151) : 


— soit à une droite double : alors le cône directeur se 
réduit à un plan double et la quadrique s’appelle un cylindre 
parabolique, d’équation 

x 2 + 2G 1 x + 2H,y + 2/,z+J = 0, 

ou, en prenant un repère convenable: Y 2 -2pX =0. Cette 
surface est un cylindre dont la section plane par un plan non 
parallèle aux génératrices est une parabole. 

— soit à deux droites distinctes ; alors le cône directeur 
se réduit à deux plans distincts et la quadrique s’appelle un 
paraboloïde, d’équation : 

ax 2 + py 2 + 2 G 1 x + 2 H, y + 2 ^ z + = 0 (a et p ^ 0). 

Le paraboloïde est dit elliptique si a et p sont de même signe, 
hyperbolique si a et p sont de signes contraires. 

Par une translation convenable des axes, on peut représen¬ 
ter un paraboloïde par l’équation Z = aX 2 + bY 2 . Cette surface 
peut être engendrée par une parabole /7dont le sommet décrit 
la parabole (P) : X = 0, Z = bY 2 , avec comme position initiale 
(O) : Y = 0, Z = aX 2 , soit par translation d’une parabole dont la 
position initiale est (P) et dont le sommet décrit (Q). P et Q 
sont appelées les paraboles principales du paraboloïde. 

Une parabole tournant autour de son axe engendre un 
paraboloïde de révolution d’équation Z= a{X 2 + Y 2 ). 

• Si la conique à l’infini ne se décompose pas, le cône 
directeur est lui-même indécomposé et l’on obtient alors une 
quadrique possédant un centre de symétrie, et un seul, et au 
moins trois plans de symétrie, rectangulaires deux à deux. 
Avec un système convenable de coordonnées, l’équation de la 
surface peut se mettre sous la forme 

aX 2 ^pY 2 ^c'yZ 2 ^^. (1) 


1 er cas : le cône directeur est imaginaire (a, p, y de 
même signe tous les trois). 

— Si a, p, y sont tous trois négatifs, la surface est un 
ellipsoïde imaginaire. 

— Si a, p, y sont tous trois positifs, c’est un ellipsoïde 
réel, dont l’équation peut s’écrire sous la forme 


X 2 

a 



+ 


Z 2 

cT 2 


= o 


(la sphère est un cas particulier de l’ellipsoïde). 

2 e cas : le cône directeur est réel (a, p, y non de même 
signe). On obtient deux types de surface : 



La première s’appelle un hyperboloïde à une nappe, la 
seconde, un hyperboloïde à deux nappes. 

• En résumé : 

— Si la conique à l’infini se décompose, la quadrique 
est 

— soit un cylindre parabolique, 

— soit un paraboloïde (elliptique si a et p sont de même 
signe, hyperbolique si a et p sont de signes contraires). 

— Si la conique à l’infini ne se décompose pas, la 
quadrique est : 

a) soit, dans le cas où le cône directeur est imaginaire, 
un ellipsoïde (imaginaire si a, p et y sont négatifs, réel si a, p 
et y sont positifs), 

b) soit, dans le cas où le cône directeur est réel, un 
hyperboloïde (à une nappe ou à deux nappes). 
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Intersection de deux quadriques. 

Deux quadriques se coupent : 

1° soit selon une courbe d’ordre 4 (une quartique) ; 

2° soit selon un système de courbes dont la somme des 
ordres est égaje à 4, c’est-à-dire : 

— soit une droite et une cubique gauche ; 

— soit deux coniques, pouvant se réduire chacune à 2 
droites, distinctes ou non. 

FONCTIONS DE VARIABLES RÉELLES 
Développements en série. 


Cette formule, donnée p. 118, peut être appliquée à l’étude 
locale d’une fonction. 

Formule des accroissements finis. 

Le théorème des accroissements finis permet d’étudier une 
fonction localement, c’est-à-dire sur un petit intervalle de 
variation. Par exemple, la fonction f(x) = ax 2 + bx + c donne : 

f(x + h)= a(x + hf + b(x + h) + c 

= ax 2 + bx + c + b ^2 a^x + 

Or la formule des accroissements finis s’écrit ici : 

f(x + h) = f{x) + hf'(x + Oh) = f(x) + h [2 a(x + eh) + b]. 

En comparant avec le résultat précédent, on voit que : 

h[2 a (x + eh) + b] = h^2 a(^x + ^ + &J - d’où 0 = ^, 
quels que soient h et x. 

Ce résultat correspond à une propriété géométrique classi¬ 
que de la parabole. 

Formules de Taylor et de MacLaurin. 

(Voir ces formules p. 115.) 

• Développement de quelques fonctions usuelles. 

— La fonction f(x) = cos x donne les dérivées succes¬ 
sives 


r(x) = -sinx, f"(x) = -cosx, f'"(x) = sinx, 
f l4 \x) = cos x , f (S) (x) = - sin x,..., 
d’où, d’après la formule de MacLaurin, 

( 2n +2 

7 cos 0X . 


. xxx . 

cosx =1- — + — - — + + <-1> 


(2 n + 2) ! 


On peut pousser le développement aussi loin qu’on le désire. 
Pour une valeur donnée de x, on détermine, par la formule 
précédente, la valeur de cos x avec autant de décimales que 
l’on veut. 

— Autres développements (MacLaurin) : 


. XX X 

:1+ Ï + 2Ï + 3T + ' 


n ! ( n 4- 1 ) ! 


(0 < 0 < 1 ) 


= 1 + jln a +jy(lna) 2 +- + 

+ ôT + i,.’ 


■2Ï + ÏT + - + (27)T + (2 n+ 2)! Ch<9X) 


sinx -x-fy + fj 


3! 5! (2 n — l)! (2/7+1)! 

+ 


sh(0x ) 




(2n-1j 


T + (_1) (Fiî 


(2 n +1)! 


cos 0x 


1 + x 


= 1-x + x 2 


+ (-1) n x" +(-1) n 


(1 + 0x) n+1 


, /. , x X X 

ln(1+*) = x- T + T - T 


... + 

+(-1) n 


1 


n + 1 (1 + ex ) n H 

or (a — 1)...(a — n +1) n 


(1 +X) a = 1 + aX + ——— x 2 + ••• + 


n ! 


or (a — 1)...(a — n +1)(or - n ) X n +1 
(n +1)! (1 + 0x ) n +1 


• Autres applications de développements en série. 

— Pour calculer la partie principale d’une différence 
ô = u(x) - v(x), on peut développer u(x) et v(x) jusqu’au terme 
d’un certain ordre et faire la différence des deux développe¬ 
ments. 

— Les formules de Taylor et de MacLaurin sont aussi 
utilisées pour la recherche de limites quand on est en présence 

© x — e x 

de formes indéterminées (0/0, oo/oc, etc.). Par exemple, —- 


DÉVELOPPEMENTS EN SÉRIE. FONCTIONS D'UNE VARIABLE RÉELLE 


prend la forme 0/0 quand x est égal à 0. En remplaçant le 
numérateur et le dénominateur par des infiniment petits 
équivalents, on trouve : 


— tnfin les développements limités a unetonction faci¬ 
litent l’étude locale des fon ctions (a symptotes, etc.). Par 
exemple, soit la fonction y= >^x 2 (1 - x) ; s’il existe, pour y, un 
développement de la forme ax + b+ e(x), .e(x) étant une 
fonction qui tend vers zéro avec 1/x, la droite ax+b est 
asymptote à la courbe. Cela revient à chercher un développe¬ 
ment limité dans lequel 1/x (et non plus x) est la variable. On 
a : 


— Si, quel que soit x, on a f{x + T) = f(x), la fonction est 
périodique, de période T. On peut se contenter d’étudier la 
fonction dans un intervalle d’amplitude T et de compléter par 
des translations parallèles à Ox. 

Exemple. La fonction y = sin x + sin 2 x est périodique, de 
période 2 tt, puisque 

sin (2 tt + x) + sin (4 ir + 2 x) = sin x + sin 2 x ; 

on peut donc se limiter à l’intervalle [0, 2 tt]. Mais on remarque 
aussi que 

f(- x) = sin (- x) + sin (- 2 x) = - sin x - sin 2 x = - f(x ), 

c’est-à-dire que la fonction est impaire. Le point O est donc un 
centre de symétrie pour la courbe, et il suffit d’étudier y dans 
l’intervalle [0, tt] et de compléter par une symétrie de centre O. 


y = 




et le développement suivant (voir 1) : 



= 1-^-1 
3 x 


1 1 + e 

9 x 2 


d’où : 


y = 


1 1 

- x+- + - 
3 9 


1 + e 

x 


Quand x->°o, y—»-x+( 1/3) (asymptote), la courbe est 
au-dessus de y=-x+(1/3) pour x > 0, au-dessous pour 
x< 0. 


• Le nombre e. 

— C’est la valeur de x telle que la fonction In x (fonction 
logarithme népérien) soit égale à 1. Cette valeur est unique, car 
In x est une fonction nulle pour x= 1, continue et constam¬ 
ment croissante. 

— La dérivée de y= e* est y' = e x , d’où il résulte que le 


Q h — "J 

rapport —-— tend vers 1 quand h tend vers 0. Si l’on pose 


h = In (1 + x), le rapport 



In (1 + x) 
x 


tend vers 1 quand x 


tend vers 0. Si l’on donne à x des valeurs de la forme x = 1/m, 
on aura : 


In (1 + x ) , r ,. v1/x .. 

z = —--- = In [(1 + x ) 7 ]1 quand x -► 0 , 


ou 




1 quand m 


00 . 


Autrement dit : 

ln [( 1 + ^) 1 <1( = lne) ’ d ' où ( 1+ ^)” <e - 


On démontrerait aussi que e < (1 +1/m) m (1 +1/m), d’où 
avec 0 < 0 < 1 : 


Étude de la dérivée y' = f'(x). 

— Calculer y' en utilisant les formules de dérivation. 

— Résoudre l’équation y' = 0 (ce qui s’appelle 
« chercher les zéros de la dérivée ») ; les racines réelles de 
cette équation donnent les valeurs critiques de la variable. 

— Écrire, si possible, la dérivée sous la forme d’un 
produit de facteurs et étudier, dans un tableau, le signe de 
chaque facteur, avant et après les valeurs critiques. 

— Faire le produit des signes, ce qui donne le signe de 
la dérivée pour les différentes valeurs de la variable. Si, pour 
une valeur critique x 0 de la variable, la dérivée change de signe 
(par exemple : y' < 0 pour x < x 0 et y' > 0 pour x > x 0 ), la 
valeur critique x 0 définit un maximum ou un minimum pour la 
fonction y (cet extrémum s’obtient en remplaçant x par x 0 dans 
y = f(x). 

— La croissance ou la décroissance d’une fonction 
continue et dérivable dans un intervalle peut se déterminer 
d’après le signe de sa dérivée (y' > 0 : y croissante ; y' < 0 : y 
décroissante). Mais il est possible d’étudier le sens de variation 
de la fonction y par d’autres moyens (indispensables dans 
certains cas). 


Étude de la dérivée seconde y". 

Calculer la dérivée seconde, y", et étudier ses zéros et son 
signe. La règle mnémotechnique y p) rappelle que la conca¬ 
vité de la courbe est tournée vers le haut (vers les y positifs) 
quand y" > 0, et vers le bas quand y" < 0. Quand y" s’annule en 
changeant de signe, le point correspondant est un point 
d’inflexion pour la courbe. 

Exemple. Soit la courbe y = 3x 4 -4x 3 + 1 ; étudier ses 
points d’inflexion. On a 

y' = 12x 3 -12x 2 et y" = 36x 2 - 24 x. 

L’équation y" = 0 a deux racines réelles : x, = 2/3 et x 2 = 0 ; 
on peut l’écrire, en effet, sous la forme y" = 12 x(3 x - 2) = 0, 
qui met les racines en évidence. D’autre part, y" est un trinôme 
du second degré, du signe de son premier coefficient pour les 
valeurs de x extérieures à [0,2/3] et de signe contraire pour 
0 < x < 2/3. Donc : 



2 

3 

0 + 


•-o^r (’♦£)■ 

Quand m croît indéfiniment, la limite de (1+1/m) m est 
donc e. 

— On établit aussi que e est la somme de la série 
convergente 


— Le calcul donne e = 2,718 281 828... 

Règles pratiques pour l'étude 
d'une fonction numérique. 

Déterminer les intervalles de définition. 

« Sur quelles parties de (R, ensemble des réels, la fonction 
est-elle une application ?» — « Pour quelles valeurs de la 
variable peut-on la calculer ? ». 

Exemples : 

y = ^ est définie pour tout x G IR sauf pour x = - 1 (qui 

annule le dénominateur) ; elle est continue partout où elle est 
définie et présente une discontinuité pour x = —1. D’où les 
intervalles de définition ]-<», — 1 [, ]—1, +<»[. 

y = Vx -F 3 est définie et continue pour x + 3^0, soit 
x& — 3. Elle n’est pas définie pour x< - 3. 

y = Arc sin x est définie dans l’intervalle [- 1, + 1] et conti¬ 
nue dans cet intervalle (x est le sinus de l’arc y ; un sinus est 
compris entre -1 et +1). 

y = ( 1+1/x) x est définie pour 1+1/x positif, soit 
x(x + 1) > 0 ; x doit donc être extérieur à l’intervalle [-1,0]. 

Symétrie et périodicité. 

— Si f(x) = f(- x) pour tout x, la fonction est dite paire ; 
sa courbe représentative est symétrique par rapport à Oy dans 
un repère orthogonal. On peut donc étudier la fonction pour 
x > 0 et compléter l’étude par une symétrie par rapport à Oy. 

— Si f(x) = - f(- x), la fonction est dite impaire ; la 
courbe est symétrique par rapport à l’origine O. Ici aussi, on 
n’étudiera y que pour les valeurs positives de x. 


La dérivée seconde s’annule en changeant de signe pour 
x = 0 et x = 2/3 ; la courbe admet donc deux points d’infle¬ 
xion, pour ces valeurs de la variable. 

Recherche des asymptotes. 

1° Les asymptotes parallèles aux axes correspondent 
aux deux cas suivants : 

• Si, quand x-x», y—» b, la droite y= b, parallèle à 
l’axe Ox, est asymptote à la courbe. 

• Si, quand x—>a, y-x», la droite x = a, parallèle à 
l’axe Oy, est asymptote à la courbe. 

• Si x et y tendent tous deux vers l’infini, on cherche s’il 
existe une fonction affine y^ax+ b telle que 

f(x) - ax - b 

tende vers zéro quand x-x» ; si oui, la droite y = ax + b est 
une asymptote oblique à la courbe. 

2° Règle pratique. 

— Écrire la fonction sous la forme implicite f(x, y) = 0. 

— Égaler à zéro le coefficient du terme en x de plus 
haut degré. On obtient ainsi (s’il en existe) toutes les asympto¬ 
tes parallèles à Ox. 

— Égaler à zéro le coefficient du terme en y de plus haut 
degré. On obtient ainsi (s’il en existe) toutes les asymptotes 
parallèles à Oy. 

— Remplacer y par ax + b dans l’équation f(x, y) = 0 et 
développer ; ordonner le résultat selon les puissances décrois¬ 
santes de x. Égaler à zéro les coefficients des deux plus hautes 
puissances de x et résoudre par rapport à a et b. Les droites 
d’équation y = ax + b sont asymptotes à la courbe. 

3° Exemples. 

x 3 

Asymptotes à la courbe y 2 = g - _ (cissoïde). 

On a f(x, y) = 2 ry 2 - xy 2 - x 3 = 0, soit : 

(2r-x)y 2 -x 3 = 0. 

Le terme de plus haut degré en x a pour coefficient - 1, qui 
ne contient pas y ; il n’y a donc pas d’asymptote parallèle à Ox. 
Le terme de plus haut degré en y est (2r-x): 
2r-x = 0=>x = 2r, asymptote parallèle à Oy. 

Asymptotes à la courbe y 3 = 2 Ax 2 - x 3 . Il n’y a pas d’asymp¬ 
totes parallèles aux axes (le coefficient de y 3 et celui de x 3 ne 
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FONCTIONS HYPERBOLIQUES. FONCTIONS DE PLUSIEURS VARIABLES RÉELLES 


contiennent, respectivement, ni x, ni y). Posons y = ax + b, il 
vient : 

(ax + b) 3 = 2 Ax 2 - x 3 , 

soit : (1 + a 3 ) x 3 + (3 a 2 b - 2 A) x 2 + 3 ab 2 x + b 3 = 0 ; en éga¬ 
lant à zéro les deux premiers coefficients, il vient : 

1 + a 3 = 0 et 3a s b-2A=0 

d’où l’on tire : a = - 1, b = 2 A/3. La droite y = - x + 2 A/3 est 
asymptote (oblique) à la courbe représentative de la fonction. 

Points particuliers. 

— Soit f(x, y) = 0 et les dérivées partielles f x par rap¬ 
port à x, fÿ par rapport à y. Si, en un point, fÿ = fÿ = 0, les 
valeurs de x qui vérifient cette double équation définissent un 
point singulier de la courbe. Les autres points sont les points 
ordinaires. 

— Pour déterminer les tangentes en un point singulier, 
on fait un changement d’axes en transportant l’origine au point 
considéré et en transcrivant l’équation f(x, y) = 0 dans le 
nouveau système. On égale à zéro les termes de moindre 
degré, et on obtient l’équation des tangentes au point donné. 
Si cette équation est du second degré, il y a 2 tangentes à la 
courbe en ce point, qui est alors appelé un point double ; si 
elle est du troisième degré, c’est un point triple (point d’ordre 
3) ; etc. 

— Point de rebroussement : c’est un point dont l’abs¬ 
cisse x vérifie l’équation 


La fonction y = 1 +^ 1/x a un point anguleux à l’origine (elle 
est formée de deux oranches qui se rencontrent en O). 

Fonctions circulaires inverses. 

Voir p. 149. 

Fonctions hyperboliques. 

Définition et comparaison avec les fonctions 
circulaires. 

Sur le cercle de rayon f?=1 et d’équation x 2 + y 2 = 1, on 
définit les fonctions d’un arc x telles que : 

sin 2 x -F cos 2 x = 1 
(cos x) (sin x)' - (sin x) (cos x)' = 1 

(en effet la dérivée de cos x est - sin x, celle de sin x est cos x, 
ce qui démontre la deuxième équation). 

Considérons, d’une façon analogue, sur l’hyperbole équila- 
tère définie par l’équation x 2 -y 2 = 1, hyperbole qui admet 
pour asymptotes les bissectrices des axes rectangulaires Ox et 
Oy, un point mobile M. Appelons t le double de l’aire du 
secteur AOM, considérée comme positive si OM tourne dans le 
sens direct (indiqué par la flèche), et comme négative dans le 
cas contraire. Quand M est en A, on a évidemment t = 0. 
Cherchons maintenant deux fonctions u et v de t, telles que 
l’on ait, comme pour le cercle, 


( JîlL-V LL _ o 

\ax ay / ax ay 2 

(Le 3, ou « d rond », est utilisé pour noter les dérivées 
partielles.) 

Exemple : Soit y 2 = x 3 . On a : 


f u 2 - v 2 = 1 (et non pas u 2 + v 2 = 1, en raison de l’équation 
\uv' - vu' = 1 de l’hyperbole). 

Sur le cercle, ces fonctions avaient été appelées circulaires 
(cosinus et sinus) ; sur l’hyperbole, elles seront appelées 
hyperboliques (cosinus hyperbolique, noté ch, et sinus hyper¬ 
bolique, noté sh), et l’on démontre qu’elles valent : 


f(x, y) = y 2 - x 3 = 0 ; 


IL 

ax 


- 3 x 


a f 

a y 


2 y. 


u = ch t 


e* +e 
2 



Pour que la courbe ait un point singulier, il faut que l’on ait à la 
fois: af/3x = 0 et af/3y = 0, soit - 3x 2 = 0 et 2y = 0; cela 
est possible si x = 0 et y = 0 ; donc l’origine (0, 0) est un point 
singulier pour la courbe. D’autre part, on a : 

Ü4 = _ 6x , £ JlL- .0. 

ax ay ax ay 


(Pour calculer b 2 f/bx a y, on calcule bf/bx = - 6 x et on prend 
la dérivée par rapport à y de bf/bx, soit, ici, zéro.)' 

Au point (x = 0, y = 0), on a - 6 x = 0 ; donc : 


bff 

ax ay 


d f 
ax -5 


rf 

àÿ* 


= 0- 0x2 = 0. 


Formules. 

• Formules d’addition. 

{ ch a + sh a = e a , 
ch a - sh a = e“ a , 
ch 2 a - sh 2 a = 1 . 

fch (a + b) = ch a ch b + sh a sh b , 
(sh (a + b) = sh a ch b + ch a sh b. 

f ch (a - b) = ch a ch b - sh a sh b , 
(sh (a - b) = sh a ch b - ch a sh b . 

f ch 2 a = 1 + 2 sh 2 a = 2 ch 2 a - 1 , 
(sh 2 a = 2 sh a ch a . 


Le point (0, 0) est donc un point de rebroussement. 
Remarque : En fait, la condition 


• Formules de transformation. 
Avec a + ô = p et a - b = q : 


d 2 f y à 2 f b 2 f 

ax ay j ax 2 ay 2 


n’est pas suffisante. 

Elle peut aussi caractériser un autre type de point singulier, 
appelé point d’osculation, qui se distingue du point de 
rebroussement par le fait que la courbe s’éloigne de la 
tangente dans deux directions à partir du point de contact, 
alors que, dans le cas d’un point de rebroussement, la courbe 
ne s’éloigne que dans une seule direction. Ici, l’équation 
y 2 = x 3 nous donne y = ± VF, ce qui interdit à x d’être négatif 
(car x 3 serait alors négatif et y imaginaire). Donc la courbe ne 
peut s’étendre qu’à droite de Oy et non pas de part et d’autre 
de Oy. Le point singulier est donc bien un point de rebrousse¬ 
ment. 

Allure de la courbe : 


ch p +chq = 2ch P ^ P ch P — -, 
| ch p - ch q = 2 sh P ^ - sh P 2 P , 
sh p + sh q = 2 sh P q - ch P ~ 2 ~, 
sh p - sh q = 2 sh P 2 q ch —^. 


• Tangente hyperbolique. 
On pose : 


sh a e a -1 

t h a — , — 2â : T 

ch a e +1 


et l’on a : 



— Une courbe transcendante (dont l’équation 
comprend des fonctions transcendantes, comme e x , In x, etc.) 
peut présenter un point d’arrêt, où elle se termine brusque¬ 
ment, ou encore un point anguleux, où se terminent deux 
branches de la courbe. 

Exemples. 

La fonction y = x In x a un point d’arrêt à l’origine, 
puisqu’elle n’est pas définie pour x < 0 (à cause de Inx). 


ch a 


th (a + b ) = 
1+th 2 | 
1-th 2 f ’ 


th a +th b 
1 + th a th b 


sh a 


2th; 


1 - th 2 1 


Dérivées des fonctions hyperboliques 
et fonctions inverses. 


Dérivées. 

y = ch x , y' = sh x ; 

y = sh x , y' = ch x ; 

y = th x , y ' = 1 - th 2 x = -À —. 

ch x 

Fonctions inverses. 

1° La fonction y, inverse de sh x, est tell e que sh y = x ; 
elle admet pour dérivée y' = 1 /ch y = 1 /VI + x 2 et vaut 
y = In (x + VI +x 2 ). 

2° La fonct ion y, i nverse de ch x, est tell e que ch y = x, 
d’où y = In (x ± Vx 2 - 1 ) et y’ = 1/sh y = ± 1 /Vx 2 - 1 (positive 
pour y>0, négative pour y<0). 


Fonctions réelles de plusieurs variables réelles. 

Voir aussi p. 118. 

Notion de gradient. 


• Définition. 

Dans une base orthonormée, on considère la fonction 
scalaire u liée au point M de coordonnées x, y et z. Si cette 
fonction a des dérivées partielles bu/bx, bu/by, bu/bz, conti¬ 
nues, le vecteur qui a pour composantes bu/bx, bu/by, bu/bz 
est appelé gradient de u ; on le note grad u. 

Par définition, sidMa pour composantes dx, dy et dz, on a 

du = grad u . dM 

(grad u est un vecteur ; donc le membre de droite de cette 
égalité est un produit scalaire ; voir pp. 47 et 86). 

• Signification géométrique. 

Le vecteur grad u en un point M 0 est perpendiculaire aux 
tangentes à toutes les courbes tracées sur la surface u(M) = u 0 
passant par M 0 et appelée surface de niveau. Ces tangentes 
sont dans le plan tangent à la surface de niveau en M 0 si 

gradu£ 0 


Dérivées partielles successives. 

• Notation. 

Nous poserons : fÿ = bf/bx, f ÿ = bf/by, ... L’opération b/bx 
appliquée à la fonction f peut se répéter. Nous noterons 
les symboles de dérivation partielle (opérateurs) de droite à 
gauche ; par exemple : 


b_ 

bt 


a 

az 


ay 


— * f = 
ax 


8*f 

bxyzt 


(le signe * indiquant la dérivation partielle, de droite à gauche). 
• Théorème de Schwarz. 

La loi de dérivation est commutative si les fonctions dérivées 
sont définies dans un domaine contenant le point M 0 (x 0 , y 0 , z 0 ) 
et continues en ce point : 


f xv f vx 


b b x b a 

- * - * f = - * - A 

by ax ax ay 


f . 


Fonctions homogènes et implicites. 

• Fonctions homogènes. 

— Soit un point M(x, y, z) appartenant à un domaine 
(D) et la fonction f(x, y, z) définie dans (0). Soit, d’autre part, 
un intervalle ]a, b[ comprenant 1, et fG]a, b[ ; appelons tM 
le point (fx, ty, tz). Si, pour tout ME.(D), tM G(D) et vérifie 
l’identité f(tM) = t n f(M), qu’on peut aussi écrire 
f(tx, ty, tz) = t n f(x, y, z), la fonction f(x, y, z) est dite homo¬ 
gène et de degré n. 

— Si f(x, y, z) est homogène et de degré n, ses déri¬ 
vées partielles sont homogènes et de degré n -1. 

— Pour que f(x, y, z) définie'et admettant des dérivées 
partielles continues dans (D) soit homogène de degré n, il faut 
et il suffit que : 

xfÿ(x, y, z) + yfÿ(x, y, z) + zf z (x, y, z) = nf(x, y, z) 
(identité d’Euler). 

y 

— Exemple. Soit f = Arcsin ; on a alors aussi 
ty 

f= Arcsin—. Donc fest homogène de degré 0et l’on a (identité 
fx 

d’Euler) : 

xfÿ + yfy = 0 . 

• Fonctions implicites. 

— Cas de 2 variables. Soit f(x, y) = 0 une fonction 
vérifiant certaines conditions de dérivation et de continuité. Si 
(x 0 , y 0 ) est une solution et si f' y (x Q , y 0 ) ^ 0, il existe une fonction 
y = <p(x), continue et dérivable, telle que : 

y 0 = <P(* o) et f[x, </>(x)] = 0. 

Sa dérivée est donnée par : 



La fonction y est dite implicite [dans f(x, y) = 0]. 

Exemple : Soit y 2 -2 xy= a 2 une relation définissant une 
fonction implicite y(x). On a : 

f(x, y) = y 2 - 2 xy - a 2 = 0 , 
f x = - 2 y et fy = 2(y - x ), 

donc 


— Remarque : y est définie dans l’intervalle 

Iq = (Xq Cl, Xq "F ol) \ 

dans l 0 on peut prendre un autre point, x, £ x 0 , pour lequel y 
est définie, ce qui permet de bâtir un intervalle / 1t contenant x, 
et débordant l 0 . Ainsi, de proche en proche, peut-on prolonger 
la fonction y = <p(x). On devra s’arrêter si en un point x, sont 
vérifiées simultanément les conditions 

f(x, y) = 0 et fy(x, y) = 0. 

— Cas de 3 variables. Le théorème précédent peut se 
généraliser à f(x, y, z) = 0 ; la fonction implicite z = ^>(x, y) 
aura pour dérivées partielles : 

6Z fx 9Z fy 

ax 4' 6 by f' z 

Ici, le point M 0 (x 0 , y 0 , z 0 ) est défini dans un carré du plan 
xOy, de côté 2 a, et la fonction peut être prolongée à partir 
d’un point M, de ce carré. 
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• Différentielle totale. 

Rappelons que la différentielle totale de la fonction f(x, y, z) 

6St ôf = f' x ôx+ f(dy + f' z dz. 

La condition nécessaire et suffisante pour que 
d f= P dx + Q dy + R dz soit une différentielle totale, P, Q et R 
étant des fonctions de x, y, z admettant des dérivées partielles 
premières continues dans (0), est que l’on ait 

8P = aO ap = ap a Q a/? 

dy dx ’ dZ ~ dX ’ dz ~ dy 
On peut alors calculer f(x, y, z). 

• Extrémums des fonctions de plusieurs variables. 

On les détermine en s’appuyant sur le théorème suivant : si 

u = f(x, y, z) admet des dérivées partielles au point 
A4 0 (x 0 , y 0 , z 0 ), ces dérivées partielles sont nécessairement nul- 
les si M 0 est un extrémum. 

Compléments sur les séries. 


Voir pp. 118-119, pour les définitions fondamentales. Nous 
précisons, dans ce qui suit, quelques règles pratiques. 

Généralités. 

• Terme général. 

Soit u n le terme général d’une série ; si u n est un nombre 
(réel ou complexe), la série est dite numérique ; si u n est une 
fonction de x, on a une série de fonction (exemple : séries de 
Taylor). 

Si l’on se donne u n , on peut trouver un terme de rang 
quelconque. Par exemple, soit 


1 +Vn ’ 

X X 

Le premier terme de la série est u A = -— = - ; le second 

1 + Vl 2 

x 2 

est u 2 = -— , et ainsi de suite. 

1 +V2 

• Séries illimitées. 

Considérons la série numérique u n = et désignons par 
S n la somme des n premiers termes de cette série. On a : 


— Remarque : le théorème fondamental est peu utilisa¬ 
ble ; c’est pourquoi on se contente, en général, de critères de 
convergence , qui sont simplement suffisants (mais non néces¬ 
saires), c’est-à-dire qu’ils ne permettent de conclure à la 
convergence de la série utilisée que sous certaines conditions. 

• Séries de comparaison. 

Dans beaucoup de cas on peut comparer terme à terme une 
série inconnue ( u n ) à une série (a n ) dont le caractère est 
connu, et qu’on appelle une série de comparaison. Cette 
méthode est particulièrement utile dans le cas d’une série ( u n ) 
à termes positifs : 

— si u n < a n et si (a n ) est convergente, alors ( u n ) 
converge ; 

— si u n > a n et si (a n ) est divergente, alors ( u n ) diverge. 

On utilise comme séries de comparaison les progressions 

géométriques et la série 


1 


~3 ir + 



qui est convergente si /c > 1, divergente si fcssl. 

Exemples. 

Soit u n = 1/n" ; examiner le caractère de cette série. On a : 


O H 1 1 1 1 

S" - 1 + F + 3 3 + 4 î + 5 s + 


1 

+ —T • 

n 


Comparons les termes de cette série aux termes correspon¬ 
dants de la série géométrique 

1 1 1 1 

1 ’2’2 5 ’2 3 . 

qui est convergente vers 2. On a : 


1 1 

? < 2 ' 


11 11 

3 3< 2 ï .^ r< 2^ : 


donc la série est convergente. 

Soit la série 

1 1 

1 + —+ —- 
V2 V3 


-W. 

V2 2 


-L>!. 

V3 3 


c’est-à-dire que chaque terme de la série ( u n ) à partir du 
second est supérieur au terme correspondant de la série 


S, = a i=1, 

S 2 — U-\ -f U 2 = 1 + ^ » 

S 3 = U-| + l/ 2 +U 3 = 1 + - + - , 


O „ 1 1 

S n — Ui + U2 + ‘" + U n — 1 + “+**• + - 1 • 

Or nous savons que la somme des n premiers termes de la 

progression géométrique 1, 1/2, 1/4. 1/2", ayant pour 

premier terme a = 1 et pour raison q = 1/2 est : 



Q -i 1_ 1 _! ’ 

2 2 

quand n—»<», 1/2"^0 et l’expression ci-dessus tend vers 
—| = 2. Donc 

2 S n =2 -^Xt et lim S n = 2. 

La série illimitée ( u n ), telle que S n tend vers une limite finie 
quand n—est convergente (ici, elle converge vers2). Si S n 
n’a pas de limite, la série illimitée est divergente (= non 
convergente), 

• Deux types de séries divergentes sont remarquables. 
— Les séries dans lesquelles S„ —> » quand n —> oc, telles 
que la série u n = n. On a en effet u, = 1, u 2 = 2, u 3 = 3, ... et 

S, = 1, 

5 2 = 1 + 2 = 3, 

5 3 = 1 + 2 + 3 = 6, 


Sn = 1 +2 + 3 + ••• + n 


n(n + 1) 
2 


qui tend vers l’infini en même temps que n. 

— Les séries oscillantes telles que u n = (-1)" _1 . On a, 
en effet : 

Ui = (-1)° = 1, 

^2 = (~ IV = - 1, 

U 3 = (-^) ^ =^, 


d’où 

S n = 1 -1 + 1 - 1 +1 -1 + ••• + (- I)"" 1 ; 


S n vaut donc, soit 0, soit 1, selon que n est pair ou impair. 


Rechercher si une série est convergente. 

• Théorème fondamental. 

— Une série est convergente si, et seulement si, il existe 
un entier N tel que, quels que soient m et n supérieurs à N, on 
ait I S m - S n I < e, pour tout e > 0 donné. 

— Il en résulte que, si u n ne tend pas vers zéro, la série 
u n est divergente. 


1 


1 1 
h 2 + 3 


H— + — (divergente, puisque k = 1) ; 


la série étudiée est donc divergente. 


• Critères de convergence (séries à termes positifs). 
Soit u n le terme général de la série étudiée. 

— Règle de D’Alembert : On cherche lim = A. Si 

n—►<» U n 

A < 1, la série est convergente ; si A > 1 (ou A -> oo) ( la série est 
divergente ; si A = 1 on ne peut, en général, se prononcer. 
— Critère de Cauchy : On cherche lim \fü~ n = A. Si 

A < 1, la série est convergente. Si A > 1, la série est divergente. 
Si A = 1, on ne peut, en général, se prononcer. 

U n +1 

— Règle de Duhamel : Si —-► 1 quand n —> <*> (cas 

indéterminé de la règle de D’Alembert), on étudie la limite /x de 
n (^~ 1 — quand n -» <». Si /x > 1, la série est convergente ; 

si ^x<^, la série est divergente; si /x — 1 et si le produit 

/ u n \ a 

n (-1 peut se mettre sous ta forme 1 + —, a étant 

\u n +i / n 

inférieur à un nombre positif fixe, la série est divergente. 


• Séries à termes réels de signes quelconques. 

— On étudie la série des valeurs absolues I u n I. Si cette 
série est convergente, la série ( u n ) est aussi convergente ; si 
elle est divergente, on ne peut rien dire, sauf si la divergence de 

(I u n I) a été établie en prouvant que Jinzll ou Vl u n I a une 

I u n I 

limite supérieure à 1, auquel cas la série étudiée est divergente. 

— Étant donné une série dont les termes sont alternati¬ 
vement positifs et négatifs (série alternée), si la valeur absolue 
de ces termes décroît quand n augmente et si u n a pour limite 
zéro, la série est convergente. 


• Séries entières. 


Ce sont des séries de la forme 
a 0 + a n x + a 2 x 2 h— + a n x" + ..., dans lesquelles les coeffi¬ 


cients a 0 , ai, ... sont indépendants de x. Si limite(— 2 — ) = < 

/ \ n-M0 V 3n J 

on a limite (— 1 — ) = > 

— V / 


= A = h x x. Donc la série entière étudiée 


est convergente quand |bxxl<1, divergente quand 
I h x x I > 1 ; si I /? x x I = 1, on ne peut rien affirmer. 


Séries de Fourier. 

• Définition. 


Ce sont des séries trigonométriques dont le terme général 
est 


u n = a n cos nx + b n sin nx. 


• Formules de Fourier-Euler. 

Si la série trigonométrique ( u n ) est absolument convergente 


SÉRIES 

sur l’intervalle [-tt, +it], sa somme f(x) est une fonction 
continue. On a alors en général : 

1 f + ” 

a Q = - I f(x ) cos nx dx , 
b n = i j f (x ) sin nx dx , 

3o = z— f f(x) dx . 

2 TT J tt 

• Théorème de Dirichlet. 

Si f(x) est continue dans l’intervalle [- tt, + tt], sauf peut-être 
en un nombre fini de points de discontinuité de première 
espèce, et si f{x) n’admet qu’un nombre fini d’extrémums : 

1° la série de Fourier associée à f(x) est convergente 
pour tout x tel que x G [- tt, + tt] ; 

2° sa somme est partout f(x), sauf aux points de discon- 

... , „ f(x + 0) + f(x - 0) 

tinuite, ou elle vaut ------- et aux extrémités de [- tt, 

2 

+ tt], où elle vaut —— + ^ 7r ) 

2 


CALCULS DIFFÉRENTIEL 
ET INTÉGRAL 


Compléments sur les intégrales définies. 

Voir aussi pp. 120 à 122. 

Rappelons qu’une fonction f(x), définie, réelle et bornée sur 
un intervalle [a, b] est intégrable au sens de Riemann sur cet 
intervalle si la somme 

X = (x,-a) f (& 0 ) + (x 2 -x 1 ) f(ft) + - 

+ (* n -x„_ 1 ) f(Çn-i) + (b- x n ) f(U 

tend vers une limite finie /, quel que soit le choix des £ p 
compris chacun entre x p+1 et x p , lorsque le nombre des x p croît 
indéfiniment et que le plus grand des [x p , x p+1 ] tend vers 0. On 

écrit alors 1 = j f(x) dx et on démontre que, si f(x) admet une 

primitive F, c’est-à-dire une fonction qui admet f(x) pour 
dérivée, / = F(b) - F(a). Le calcul d’une intégrale définie se 
ramène ainsi à un calcul de primitives. 

Intégrabilité d'une fonction. 

Une fonction n’est pas, a priori, intégrable, car la somme 2 
ne tend pas nécessairement vers une limite finie / ; il est donc 
nécessaire de s’assurer de son intégrabilité, tâche qui est 
facilitée par les théorèmes ci-dessous. 

• Si f{x) est intégrable sur [a, b] et sur [b, c], elle est 
intégrable sur [a, c] et l’on a /£ + /£ = / a c . 

Par récurrence, on généralise ce théorème à n segments 
consécutifs, [a, b], [b, c]... [Ac, /], avec a < b < ••• < k < I. 

• Une fonction en escalier sur [a, b] est intégrable sur 
[a, b]. 

• Cas d’une suite convergente de fonctions. 

Soit une suite f n {x) convergeant uniformément vers F(x) sur 
un intervalle [a, b]. Si les fonctions f,(x), f 2 {x), .... f n (x),... sont 
toutes intégrables sur [a, b ] à partir d’un certain rang, alors 
F(x) est aussi intégrable sur [a, b] et l’on a : 



Comme F(x) M*), l’égalité précédente s’obtient en 

permutant les symboles : J et lim 

j lim f n (x)dx = lim j f„(x)dx. 


Propriétés des fonctions intégrables. 

• Les fonctions étagées sur [a, b ] sont intégrables. 
Une fonction étagée sur [a, b] est la limite uniforme d’une 

suite de fonctions en escalier sur [a, b] ; elle est donc 
intégrable. D’autre part, toute fonction définie et monotone sur 
[a, b] est une fonction étagée sur [a, b], donc intégrable sur 
[a, b] 

• Si f(x) et g(x) sont étagées sur [a, b], f(x) g(x) est 
aussi étagées sur [a, b], donc intégrable sur [a, b]. 


• Une fonction f(x) ayant un nombre fini de disconti¬ 
nuités de première espèce sur [a, b] est intégrable sur [a, b]. 

Voir p. 111 pour les discontinuités de première espèce, 
f(x + 0) t* f(x - 0). 

• Majoration de f f(x)dx quand f(x) est étagée sur 
[a, b]: 

| J f(x)dx | ss j I f(x) I dx . 


• Si f(x) 2 * 0 est continue sur [a, b] et si /£ = 0, alors f(x) 
est nulle, quel que soit x appartenant à [a, b]. 

• Formule de la moyenne. 

Si f(x) et g{x) sont étagées sur [a, b], le signe de g(x) étant 
constant, il existe K E [A, B], A et B étant les bornes de f(x) 
sur [a, b], tel que : 


i. 


f(x ) g (x ) dx = K 



dx . 
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CALCUL D'INTÉGRALES 


Si l’on prend g(x) = 1, la formule précédente s’écrit 

J f(x)dx = K J d x-K(b-a). 
et, avec a < c < b : 

J b f(x)dx = K (b - a) = (b - a) f(c). 

Cette formule est connue sous le nom de formule de la 
moyenne. 

• Inégalité de Schwarz. 

Si f(x) et g(x) sont étagées sur [a b], avec a < b, A étant un 
nombre réel quelconque, on a: 

J* [f(x)+ \g (x )] 2 dx 5=0 , 
d’où l’on tire l ’inégalité de Schwarz : 


f(x) g (x)dx i«c f 2 (x ) dx x J b g 2 (x ) dx . 


• Remarques. 

— Une fonction étagée est intégrable au sens de Rie- 
mann, mais une fonction intégrable au sens de Riemann n’est 
pas nécessairement étagée. On peut démontrer le théorème 
suivant : 

La condition nécessaire et suffisante pour que f(x), définie et 


bornée sur [a, b], soit intégrable i 




tende vers zéro lorsque m->*>, M p et m p étant les bornes 
supérieure et inférieure de f(x) sur le segment [x p , x p+1 ], la 
somme 2 étant étendue aux 2 m segments partiels [x p , x p+1 ] 
égaux. 

— Ce théorème est indépendant de la théorie des 
fonctions étagées et permet de retrouver les propriétés précé¬ 
dentes. 


Critères de convergence. 

Voir p. 122. 

Lorsque une (ou deux) des limites a et b de l’intervalle 
d’intégration devient infinie, il y a lieu de se demander si lî a 
une limite, c’est-à-dire si l’intégrale converge (on dit aussi « a 
un sens » ou bien « existe »). 

On démontre que l’intégrale / converge quand b—si, et 
seulement si, F(x) - F(x')—> 0, quand x et x' tendent vers b 
indépendamment l’un de l’autre. 


Calcul d'intégrales. 


Généralités. 

Il n’existe pas de méthode générale permettant de calculer 
une primitive d’une fonction quelconque ; il est donc mal venu 
de parler du calcul d’intégrales, il vaut mieux dire les calculs 
d’intégrales. 

• Pour calculer f(x) dx, on peut faire deux opéra¬ 
tions : ' a 

— Trouver une primitive indéfinie F(x) de f(x), soit à 
l’aide d’une table, soit en ramenant la fonction à intégrer à une 
forme figurant dans une table. Ainsi, soit à calculer 

/ = j 2 x 3 dx ; on sait que la fonction x 4 /2 admet 2 x 3 pour 

dérivée, donc que les primitives de 2 x 3 sont de la forme 
(x 4 /2) + C, C étant une constante. On retient la forme 


— Remplacer x par a et b dans la primitive indefinie 
F(x), ce qui donne F(a) et F(b), et calculer F(b) - F(a) = /. Ici : 

F(a) = ^-, F(b)=-|-; donc / = b g B 

• Il peut se trouver qu’on ne précise pas les limites a et 
b de l’intégration. Dès lors, le résultat est donné sous une 
forme indéterminée, à une constante pvès. Exemple : 

J 2 x 3 dx =y + C - 


C étant une constante d’intégration indéterminée. 

Un cas particulier est celui des fonctions logarithmes. On 
sait, par définition, que la fonction In x admet 1 /x pour dérivée 
(c’est-à-dire : est une primitive de 1/x). Si l’on a à calculer 


= f — = f — dx, la solution évidente est donc 
J x J x 


/ = In x + C . 

On pose alors C = In c, et il vient : 

/ = In x + ln c = In ex. 


Formes élémentaires classiques. 

u et v sont des fonctions dérivables de x ; du, dv, dx sont 
des différentielles, C une constante. 

• Formules. 


(du+dv)=u+v+C. 

( 1 ) 

A du = A J du = Au + C . 

( 2 ) 

d x = x + C . 

(3) 


u du = 


du 


n +1 


+ C. n/ -1 . 


— = In u + C = In eu , avec C = In c . 
u 


a 


a u du = 7 —- 1 - C . 

In a 


du = e u + C . 

du = - cos u + C . 
cos u du = sin u + C . 


| sin u 


tan u du = In - 


1 


■ + C . 


cos u 

cot u du = In sin u + C . 


du 1 . u _ 

—2 - 2 = — arctan — 1 - C . 

u + a a a 


du 


u - a 
du 


1 , u 

1 = — In — 


-+C . 


___„ = arcsin — + C . 

Va z -u “ a 

du 




— = In (u + Vu 2 ± a 2 ) + C . 


(4) 

(5) 

( 6 ) 

(7) 

( 8 ) 

(9) 

( 10 ) 

( 11 ) 

( 12 ) 

(13) 

(14) 

(15) 


• Applications des formules. 

L’application n’est pas toujours « automatique » : il faut 
parfois quelques transformations simples pour que le calcul 
puisse se faire. Si les transformations « simples » ne donnent 
rien, il faut utiliser d’autres techniques de transformation 
indiquées ci-après. 

Intégration des fractions rationnelles. 

• Méthode générale. 

Soit à calculer / = f \ dx , A(x) et fî(x) étant des polynô- 
J B (x) 

mes en x. 

— Diviser A(x) par B(x), on obtient : 

f P(x) : polynôme de degré 


A(x) 


= F(x) + 


D (x ) J (d° A - d° B), 


B(x) ) 0(x) : polynôme tel que 
^ d° D < d° B. 


B (x ) 

— L’intégrale est alors de la forme : 

J K ) + f$] « x - J P(x)dx + / '§(7) dx ■ 

Le premier terme s’intégre immédiatement. Soit 




P(x) dx. 

— Décomposer en éléments simples, et intégrer 

séparément ces éléments, ce qui donne les intégrales / 2 , / 3| ..., 

— / = / 1 + / 2 + / 3 + ... /„. 

• Exemple. Calcul de 


■1 


(2 x 3 + 1 )dx 
x 2 + 3 x +2 

14x +13 


= /l dx 


- 2 X - 6 + - z A . 
B x +3 x +2 


/ 1 = ( 2 x - 6 )dx = x 2 - 6 x + Ci. 


14x +13 


14x +13 


1 15 

- + - 


x + 3 x + 2 (x + 1) (x + 2) x+1 x + 2 ’ 

décomposition en éléments simples ; par suite, 
dx 

J X 

15 dx 


/ 2 = - 


et 

d’où 


■1 


— — In (x + 1 ) + C 2 \ 


x +2 


x +1 

= 15 In (x + 2) + C 3 ; 


/ 2 + / 3 = - In (x + 1) + C 2 + 15 In (x + 2) + C 3 


= ln 0L±2£ +C2 + 

X+1 

/ = /-| + 12 !3 ~ x 2 6 x + In 


C 3 . 

(x +2) 1 
x +1 


+ C. 


• Remarque. 

Les calculs peuvent être longs et compliqués. L’utilisation de 
tables d’intégrales permet d’obtenir les solutions sans diffi¬ 
culté, les calculs ayant été faits une fois pour toutes. Des livres 
entiers, comportant les primitives d’un très grand nombre de 


fonctions types, ont été publiés ; ils soulagent avantageuse¬ 
ment les calculateurs. 


Intégration par changement de variable. 

• On peut, dans certains cas, remplacer la variable x 
par une nouvelle variable t telle que x = g(t). On a alors 

dx = g'(t)dt et f f(x)dx = J f [g(t )] g '(t ) df = 

= J *p(f)df. 


Cette intégrale peut être plus simple à calculer que J f{x) dx ; 

une fois qu’elle est trouvée, on transforme le résultat en 
substituant x à f, avec t = g~\x). 

Cette méthode est employée notamment pour transformer 
une fonction irrationnelle de x en une fonction rationnelle de t 
(intégration par rationalisation). 

Exemple : Calculer 


/ = 


1 


_dx_ 

V(1 + x ) 3 + Vl + x 


On observe que f{x) n’est pas une forme usuelle, ni une 
fraction rationnelle ; employons donc la méthode par change¬ 
ment de variable. Posons u 2 = 1 + x (pour rendre le dénomina¬ 
teur rationnel). Il vient 


2 u du = dx , V(1 + x f = u 3 et Vl + x = u , 


d’où 



2 u du _ f du 

T r T7 = 2 J 


On reconnaît dans I — 2—7 la formule (12), avec a = 1 ; 
donc: J u +1 

r du _ 

/ = 2 —5 —- = 2 arctan u + C = 2 arctan Vl + x + C 

J u 2 +1 


(puisque u = 


• Si l’on calcule une intégrale définie par cette 


méthode, il faut penser à changer les limites. Ainsi 



dx 


donnerait, dans l’exem ple p récédent : 

quand x = 3, u = Vl + 3 = 2 
et quand x = 8, u = V1 + 8 = 3 ; 
donc 


/ 


8 

3 


f(x)dx 



du 

u 2 +1 ' 


• Quelques formules usuelles. 

— Si f(x) ne comprend que des puissances fractionnai¬ 
res de a + bx, on fait le changement de variable a + bx = u n , n 
étant le PPCM des dénominateurs des exposants fraction¬ 
naires. 

— Si l ’expression à intégrer ne contient que le radical 
Vx 2 + bx + c , on fait le changement de variable 
Vx 2 + bx + c = u - x ; d’où : 


x 


b +2 u 


et dx 


2(u 2 + bu + c ) du 
(b + 2 u) 2 


— Si l’ expression à intégrer ne contient pas d’autre 
radical que V- x 2 + bx + c, on fait le changement de variable. 
V- x 2 + bx + c = (x - a) u ou (/3 - x) u, a et p étant les raci¬ 
nes réelles de - x 2 + bx + c. 

Si a et p sont complexes, on ne peut pas appliquer 
simplement cette transformation. 

— Différentielle binôme. C’est une expression qui peut 
toujours se mettre sous la forme x m (a + bx n ) p dx, m et n étant 
entiers, n étant positif, et p entier ou fractionnaire de la forme 
p = r/s (r et s entiers). 

— Si m + = un nombre entier ou 0, on pose 


a + bx" = u s . 

— Si + p = un nombre entier ou 0, on pose 

a + bx" = u s x". 

• Remarques. 

Ici aussi, les tables allègent les calculs. Elles sont d’un usage 
courant chez les mathématiciens anglo-saxons, notamment 
américains. ' 

Intégration par parties. 

• Formule d’intégration par parties 
(u et v: fonctions dérivables de x). 

De d(uv) = udv+ vdu, on tire udv = d(uv)- vdu, d’où la 
formule 

judv = uv-J vdu . 

• Application de la formule. 

— Il faut décomposer f(x) dx en deux facteurs, u et d v. 
— Il n’y a pas de règles générales ; néanmoins, il faut 

choisir dv de telle sorte qu’on puisse calculer J dv. 

— Le calcul de J dv peut imposer une nouvelle 

intégration par parties ; et ainsi de suite. 

— La formule est très utile pour l’intégration des diffé- 
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rentielles contenant des produits, des logarithmes, des fonc¬ 
tions circulaires inverses. 

• Exemple. Calculer : / = j x 2 In x dx. 

Appliquons / = uv - vdu en posant 


/ = f [ f(x, y)dx dy = f dx. [ f(x, y)dy , 

J J (D ) J 3 J <Pi(x) 

y = (pi(x) et y = <p 2 (x) étant les équations des courbes limitant 
le domaine MNPQ. 

— Coordonnées polaires (voir figure ci-dessous). 



f x 3 
u v = I dv = —. 


Il vient : 

et 

D’où : 


uv = — In x 


i vdu= J x * dx = 


, X 3 , x 3 x 3 / , 1 \ _ 

T nx 9" = T \ nx— 3/ + ^ 

• Exemple d’intégration par récurrence. 
Calculer l’intégrale l m = J x m e x dx (m = entier positif). 


posons 


Il vient : 


u = x m , d’où du = mx r 
dv = e x dx , d’où v = e x . 


I m = uv 


j vd U = x"e-- J 

" - m J x ”" : 


mx m 1 e x dx 
e x dx. 


Mais J x m 1 e x dx n’est autre que l’intégrale à calculer dans le 
cas où m est remplacé par m -1 ; donc 

J x™ 1 e x dx = / m1 et l m = x m e x - ml m _,. 

On calcule / m _ 1t en intégrant par parties : 

/ m _, = x'” -1 e x - (m - 1) / m _ 2 , 

et ainsi de suite jusqu’à l 2 = x 2 e x - 2 /, et /, = xe x - e x . Finale¬ 
ment, on obtient : 

Im = e x [x m - mx m_1 + m(m- 1 ) x m 2 -+ (- 1 ) m m !]. 

Cas particulier : prenons m = 3, on trouve : 

/ 3 = x 3 e x -3/ 2 , / 2 = x 2 e x -2/ 1 , / 1 = xe x -e x , 

d’où 

/ 3 = x 3 e x -3[x 2 e x -2(xe x -e x )] 

= e x (x 3 - 3 x 2 + 6 x - 6). 



/ 



/(p cos 0, p sin 0 ) dœ 



f(p cos 6, p s'\r\ 0) p dp . 


• Calcul de volumes. 


— Volume compris entre les surfaces z, = f,(x, y) et 
z 2 = f 2 (x, y), intérieur à un cylindre de base (D) dans le plan 
des xy: 


-//. 

■C V 


(fe- fi)dx dy 



S(x)dx , 


S(x) étant l’aire de la section du volume par un plan 
perpendiculaire à Ox. 

— Volume compris entre deux plans perpendiculaires à 
l’axe des x (x = a et x = b) et limité par la surface engendrée 
par une courbe d’équation y = f(x) en tournant autour de cet 
axe : 

V = j ir[f(x)] 2 dx. 

Si S(x) est du troisième degré au plus, en appelant B et B' 
les surfaces de base du volume, B" la section moyenne par le 
plan équidistant des plans de base et H la hauteur, on a : 


Intégrales multiples. 

Intégrales doubles. 


V = — (8 + B' + 4 B' 1 ) (formule des trois niveaux). 
b 

Intégrales triples. 

• Définition. 


• Définition. 

Soit un domaine fermé plan (D) limité par un.contour simple 
(C) et soit une fonction f(x, y) définie sur (D). Divisons le 
domaine (D) en n domaines, de surfaces o> u (o 2 ,..., <o h ..., (o n . La 
fonction f est dite intégrable sur(D) si la somme S f(x„ y ,). <«>, 
a une limite, les points (x f , y,) appartenant au domaine de 
surface to h lorsque la surface de chaque domaine tend vers 
zéro, quel que soit le mode de division de (D) et quel que soit le 
choix des points (x,, y,). On note : 

lim 2 f(M,) coi = [ [ f(M ) do> (intégrale double) , 

J J (D) 

et on lit « somme double dans (D) de (M) ». 

• Calcul des intégrales doubles. 

— Coordonnées rectangulaires : f(x, y) = 0 étant 
l’équation de (C), a et b définis sur la figure ci-dessous : 



Même principe que pour l’intégrale double, mais le domaine 
plan (D) est remplacé par un domaine fermé dans l’espace, ( V), 
admettant un volume, et divisé en n volumes v,. La somme 


2 f{Mj) Vj a pour limite / = J J J f(M)dv, intégrale triple sur 
(V) de f(M). 

Interprétation géométrique : si f(M) désigne la densité au 
point M, I est la masse du solide défini par ( V ). 


• Calcul. 

— En coordonnées rectangulaires, 



f (x, y, z ) dx dy dz 


r<P 2 <*.y) 

dx dy f (x, y, z) dz , 


<P\ et <p 2 désignant les aires limitant ( V) (ce sont les bases du 
cylindre dont les génératrices sont parallèles à Oz et 
s’appuient sur les contours fermés de et <p 2 ; tous les points 
de <pt et (p 2 se projettent sur (D) 

— En coordonnées semi-polaires : 

r r r <p 2 (p 

/ = p dp de \ f(p cos 0 , p sin 6 , z ) dz . 

J JiD) JviïP.e') 


• Moments d’inertie. 

Soit un solide de volume V, de densité Ô{M) et soit r(M) la 
distance du point Ma un point, une droite ou un plan fixe. On 
appelle moment d’inertie du solide par rapport à ce point, cette 
droite ou ce plan, l’intégrale triple : 


/ = r z (M) ô(M ) dx dy dz 

(r = fonction de x, y, z ). 


On démontre (théorème de Huygens) que l D = l A + Ma 2 ( l D , 
l A , moments d’inertie par rapport aux axes parallèles D et A, 
M : masse du solide ; a = distance entre D et A). 


GÉOMÉTRIE INFINITÉSIMALE 

Résolution des équations différentielles. 

Nous n’indiquons ici que les méthodes classiques. 

Équations différentielles du premier ordre. 

Équations dans lesquelles la plus haute dérivée de la 
fonction cherchée est sa dérivée première y'. 

• Équations à variables séparables. 

— Elles sont de la forme f(x) dx = <p(y) dy, d’où l’on tire, 
en intégrant les deux membres : 

j f (x) dx = j <p(y)dy + C . (1) 


L’équation (1) donne l’intégrale générale et représente les 
courbes intégrales. 

— 1 er exemple. Résoudre l’équation ydx- xdy = 0. On 
a immédiatement 


dx dy 

x ~ y ’ 


d’où 


i 


dx 

x 




soit In x = In y +C = In cy et cy = x, qui peut encore se mettre 
sous la forme y = mx, avec m = 1/c. L’équation (1) représente 
les courbes intégrales, qui sont toutes les droites de la famille 
y = mx (m > 0, puisque c est positif, car il est défini par 
C = In c et la fonction logarithme n’est définie que pour une 
variable positive). 

— 2 e exemple. Trouver une courbe telle que la tangente 
ait une longueur constante a. De nombreux problèmes de 
géométrie analytique, dans le genre de celui-ci, conduisent à 
une équation différentielle du premier ordre. Rappelons que 
l’on a PT = y/y', PN = yy' et, naturellement, PM = y = f(x). 

Le problème exige MT = a, soit VP T 2 + PM 2 = a, d’où 
l’équation différentielle du 1 or ordre 



ret, en 


En résolvant par rapport à y', on trouve y' = y 

Va 2 -y 2 

remplaçant y' par dy/dx, on aboutit à une équation à variables 
séparables, dont la solution, explicitée par rapport à y, est : 


, -V-1 +VaV 

l y y I y 


± x = - sa In 

(e=±'\ et du signe de y). 

Les courbes correspondantes s’appellent des tractrices. 


• Équations homogènes par rapport à x et y. 


— De telles équations peuvent toujours se mettre sous 
la forme dy/dx = f(y/x) ; on pose alors t = y/x, et l’équation 


d t 

f(t)-t 


on est donc ramené au problème précé¬ 


dent. Après l’intégration, on remplace t par y/x. 

La famille des courbes intégrales vérifiant une équation 
homogène en x et y est invariante dans le groupe des 
homothéties ayant pour centre l’origine des coordonnées, et 
réciproquement. 


— Exemple. Trouver une courbe telle que l’on ait 
ÔP 2 =ÔNÔT. On a: ÔP = x, ÔN = ÔP-PN = x + yy'. 
OT = OP + PT = x - (y//). D’où l’équation 


x 


2 


(x + yy ') ( x -y)j , 


qui conduit à 


xyy 


xy 2 « 

- JL- y 2 = 0 

y 


et, après multiplication des deux membres par y' et division par 
y, à : 


x 




= 0, 


( 2 ) 


soit : 




en résolvant (2) comme une équation du second degré ordi¬ 
naire, d’inconnue dy/dx. 

~ . ., . dx -2df 

On pose y - tx, d ou : — =-. 

x t ± Vf 2 +4 

Pour intégrer à droite, on a intérêt à poser ± Vf 2 + 4 = u - t, 
d’où, finalement, les équations 

x = — e 2/ “ 2 et y =Ç ^ 2 r 4 V -, 
u 7 2 u 2 

qui définissent paramétriquement les courbes intégrales 
répondant à la question. 

• Équations linéaires. 

Elles sont de la forme y' + Py + Q = 0, P et Q étant des 
fonctions quelconques de x. Voici la marche à suivre pour les 
résoudre, u et v étant deux fonctions de x. 
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EQUATIONS DIFFERENTIELLES 


— Poser y=uv, v étant arbitraire (u se calculera 
d’après v). 

— L’équation devient, avec y' = u' v + v' u : 

u( V + Pv) + vu' + Q = 0 . (3) 

— Déterminer v en posant v'+ Pv = 0, d’où 
= - Pdx; v est alors calculable par intégration. 

— Porter la valeur obtenue pour v dans l’équation (3), 
qui devient 

vu ' + Q = 0, d’où du = - —dx . 


— On en tire u = - —dx + C 

J v 

et 

y = uv = - v j ^dx -F Cv . 

Équation de Clairaut. C’est une équation linéaire de la forme 

y= xy' + <p(y'). 

Elle s’intégre en posant y' = p ; l’équation devient 

y = px -F f (p ) et l’on obtient ^x + f '(P ) j = 0 • 


D’où les solutions : 
dp 

-= 0, donc p = C te = C, et l’intégrale générale 

dx 

y= Cx+ f(C), qui représente une famille de droites ; 

— x + f(p) = 0, d’où y = px + f(p) et x + f(p) = 0. Ces 
deux équations définissent Vintégrale singulière. La courbe 
qui la représente est l’enveloppe des droites précédentes. 


• équations de Bernoulli. 

De la forme / + Py + Qy n = 0, P et Q désignant des fonc¬ 
tions quelconques de x, n étant quelconque. Elle s’intégre en 
divisant par y", ce qui donne : 

y'" / + Py 1n + 0 = 0; 

on pose y 1- " = u, et l’on est ramené à une équation linéaire. 


• Trajectoires orthogonales. 

— Soit un faisceau de courbes f(x, y, A) = 0 (A = C t0 
différente pour chaque courbe). On appelle trajectoire ortho¬ 
gonale de ces courbes une courbe qui les rencontre toutes à 
angle droit. On montre qu’en général le faisceau des trajectoi¬ 
res orthogonales aux courbes f(x, y, A) = 0 a pour équation 
différentielle l’équation obtenue en changeant y' en -1/y' 
dans l’équation différentielle du faisceau f(x, y, A) = 0. 

— Exemple : Quelles sont les trajectoires orthogonales 

x 3 

des cissoïdes définies par l’équation y 2 = —-? 

— L’équation différentielle de ces cissoïdes s’obtient en 
écrivant l’équation donnée sous la forme 

(x 2 + y 2 ) x - Cy 2 = 0 ; 


en différenciant celle-ci par rapport à x, ce qui donne 
3 x 2 + y 2 + 2 xyy' - 2 Cyy' = 0 , 
et en éliminant C, on obtient : 

y(3 x 2 + y 2 ) - 2 x 3 y' = 0 . (5) 

— On remplace y' par - 1/y' et l’on obtient l’équation 
différentielle des trajectoires orthogonales : 

yy'(3 x 2 + y 2 ) + 2 x 3 = 0 . (6) 


— On résout (6), qui est une équation homogène en x et 
y (poser y/x = t), et l’on trouve l’équation des trajectoires 
orthogonales aux cissoïdes : 


(x 2 -F y 2 ) 2 - C(2 x 2 -F y 2 ) = 0 . 


Équations différentielles du second ordre. 

Équations où la dérivée d’ordre le plus haut est une dérivée 
seconde, y". 

• L’équation ne renferme pas y. 

Elle est alors de la forme f{y", y', x) = 0. Méthode de résolu¬ 
tion : 

— Poser y' = u, d’où y" = du/dx. 

— On est ramené à f(du/dx, u, x) = 0, qui est du 
1 er ordre. 


• L’équation ne renferme pas x. 
On pose encore 


y ' = u, d’où y" 


du du dy _ du 
dx dy dx dy 


et l’équation est ramenée au 1 er ordre : 

f { u iï ' u ’ y ) =0 

• Équations linéaires du second ordre à coefficients 
constants. 

Elles sont de la forme : 

y" + ay’ + b = 0 (équations sans second membre), 
ou y" -F ay' + b = f(x) (équations avec second membre). Leur 
résolution fait intervenir l’examen de l’équation du second 
degré : 

f(r) = r 2 + ar + b = 0 , 

appelée équation caractéristique. Nous désignerons les raci¬ 
nes de cette équation caractéristique par a et p (a et p réels et 
distincts : a = p ; a et p imaginaires conjugués : a = p + q i, 
£ = p-qi). 

Les méthodes de résolution sont indiquées dans le tableau 
ci-dessous. 


ï— y" + ay' + b = 0. (1) 

On résout l’équation caractéristique et l’on obtient trois cas 
possibles, selon a et p : 

1° a p et réels : 

2° a = /3 (racine double) : 

y — Ce ax -F Ce 0 *. 

y = e ax (C+C' x). 

3° a = p + q\, fi = p ■ - qi : 

y = e px (C cos qx + C’ sin qx). 

: 

Il — y" + ay' + b = F(x). (2) 

y = solution générale de l’équation sans second membre 
-F une solution particulière quelconque, /, de l’équation avec 
second membre. 

1° F(x) est un polynôme P(x) : 

1 = polynôme de même degré que P(x) (si b £ 0). 

j A 7 ^ a et P : 

i--4-.". 

2° F(x) = Ae A V A = a ou /3 : 

A et A : constantes. ' 

,—4-,,»*. 

|a = a = p (racine double) : 

, n 2 Ax 

'“nir e • 

3° F(x) = P(x) + A e AX + B e** + .+ L e" x , 

P(x) : polynôme. 

On calcule une' intégrale particulière de chacune des 
équations suivantes : 

y" -F ay' + by = P(x), y" + ay' + by = >4 e Ax , etc. 

La somme de ces intégrales est intégrale de (2). 

4° F(x) contient des termes de la forme A cos mx et 

B sin mx. 

On remplace 

e mix +e“' nix e /r1ix -e~ mix 

cos mx par --- et sin mx par - - -- , 

et l’on est ramené aux cas précédents. 

Pour les équations d’ordre supérieur à deux, le lecteur est prié de se reporter aux traités spécialisés. 
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cien français - 73, 105. 

Betti (Enrico), 1823-1892, ma¬ 
thématicien italien - 6, 105, 
129, 131 ; voir aussi Nombre 
(en Mathématiques). 

Bézout (Étienne), 1730-1783, 
mathématicien français - 12, 
58 ; voir aussi Théorème (en 
Mathématiques). 

Bhâskara (surnommé Atchâ- 
rya le Savant), v. 1085-v. 
1114, mathématicien indien 
-4. 

Bianchi (Luigi), 1856-1928, ma¬ 
thématicien italien - 78, 124. 

Bijection-réciproque : 21. 

Bijective - application — : 21. 
Binet (Jean-Philippe-Marie), 

1786-1856, astronome et ma¬ 
thématicien français - 58. 

Binôme -de Newton : 24, 

33, 109 ; formule du — (a + 
b) : 24. 

Binomial - loi — e : 134. 
Bipoint - 81 ; milieu d'un —; : 
82. 

Birapport (= rapport anharmo- 
nique) - 88. 

Bireni (al-) - voir Birùnî (al-). 
Birunî (al-Bïrünî, Abü r-Rayhân 
Muhammad b-Ahmad al-Bïrü- 
nï) -89, 137. 

Bissecteur -d'un dièdre : 

145. 

Bissectrice 145. 

Bohr (Harald August), 1887- 
1951, mathématicien danois 

- 105, 125. 

Bois-Reymond (Paul du), 1831- 
1889, mathématicien alle¬ 
mand - 105. 

Boltzmann (Ludwig), 1844- 
1906, physicien autrichien - 
132. 

Bolyaï (Jénos), 1802-1860, ma¬ 
thématicien hongrois - 6, 14, 
73, 148. 

Bolzano (Bernhard), 1781- 
1848, logicien, mathémati¬ 
cien et philosophe tchèque - 
53, 107, 110; voir aussi 
Théorème (en Mathémati¬ 
ques). 

Bombelli (Raffaelle), 7-1572, al- 
gébriste et ingénieur italien - 
5. 10, 11, 52, 53. 

Bompiani (Enrico), 1889- 
mathématicien italien - 78, 

124. 

Bonnet (Pierre-Ossian), 1819- 
1892, mathématicien fran¬ 
çais - 105, 124. 

Boole (George), 1815-1864, lo¬ 
gicien et mathématicien an¬ 
glais - 6, 13, 15, 42, 50, 58, 
132; voir aussi Algèbre 
(structure algébrique). 
Booléen (= ensemble des par¬ 
ties) - 15. 

Bord (en Topologie) - 131. 

Borel (Armand), 1923- , ma¬ 

thématicien suisse - 36. 

Borel (Emilq Félix Édouard Jus¬ 
tin, dit Emile), 1871-1956, 
homme politique et mathé¬ 
maticien français - 14, 105, 

125, 132. 

Borne — inférieure : 18 ; —s 
d'un ensemble ordonné ; 
17 ; — supérieure : 18. 
Bossut (abbé Charles), 1730- 
1814, mathématicien fran¬ 
çais - 1. 

Bott (Raoul), 1923- , mathé¬ 

maticien hongrois, naturalisé 
américain en 1959 - 36. 

Boule (en Mathématiques) — 
fermée, ouverte : 106, 118; 

- ouverte : 106. 

Bourbaki (Nicolas), pseudony¬ 
me collectif d'un groupe de 
mathématiciens français - 1, 
5, 6, 13, 14, 15, 78. 

Bouteille de Klein - 129. 


Brahe (Tyge, dit en tchèque 
Tycho), 1546-1601, astrono¬ 
me danois - 103. 

Bravais (Auguste), 1811-1863, 
physicien et minéralogiste 
français - 6, 132. 

Brianchon (Charles Julien), 
1783-1864, mathématicien 
français - 77. 

Briggs (Henry), 1561-1630, ma¬ 
thématicien anglais - 38, 104. 

Brill (Alexander von), 1842- 
1935, mathématicien alle¬ 
mand - 6. 

Brioschi (Francesco), 1824- 
1897, mathématicien italien 
- 58, 78, 94. 

Brouwer (Luitzen Egbertus 
Jan), 1881-1966, mathémati¬ 
cien néerlandais - 6, 14, 129. 

Bruins (Evert Marie), 1909- 
, mathématicien et phy¬ 
sicien néerlandais - 2. 

Buffon (Georges Louis Leclerc, 
comte de), 1707-1788, écri¬ 
vain et naturaliste français - 
132. 

Burali-Forti (Cesare), 1861- 
1931, logicien italien - 13. 

Bürgi (Joost, dit aussi Jobst), 
1552-1632, horloger et ma¬ 
thématicien suisse - 103. 

Büzgànï (al-, Abü l'-Wafà 3 ) - 
voir Abü T-Wafà 3 al-Büzgânï. 


c 

Calcul (en Mathématiques) — 
algébrique élémentaire 
140; — de déterminants : 
143; — des différences : 
104 ; — des fluxions : 104 ; 

— des probabilités : 132; 

— des résidus : 124 ; — 
différentiel et intégral (= 

— infinitésimal) : 5, 119, 
157 ; Histoire du — des pro¬ 
babilités : 132; invention du 

— différentiel et intégral : 
11, 102 ; — matriciel ; 47 ; 

— sur les fractions : 140; 

— sur les nombres com¬ 
plexes : 142; — sur les 
nombres entiers : 139 ; — 
sur les polynômes : 142 ; — 
sur les puissances : 142 ; — 
tensoriel : 58, 66. 

Calotte sphérique - 147. 
Canonique - application — : 
22 ; forme — : 65 ; symé¬ 
trie — : 22. 

Cantor (Georg Ferdinand Lud¬ 
wig Philipp), 1845-1918, ma¬ 
thématicien allemand -1,5, 
6, 13, 15, 19, 25, 53, 54, 55, 

105, 128 ; voir aussi Axiome, 
Théorème (en Mathémati¬ 
ques). 

Cantor (Moritz Benedikt), 1829- 
1920, mathématicien alle¬ 
mand - 1. 

Caractères de divisibilité - 

139. 

Caractéristique (en Mathéma¬ 
tiques) -d'un corps : 45 ; 

fonction — : 133; polynô¬ 
me — : 63. 

Caractéristique universelle - 

13. 

Cardan (Gerolamo Cardano, dit 
Jérôme), 1501-1576, mathé¬ 
maticien, médecin et philoso¬ 
phe italien -5, 10, 11, 12, 72, 
132, 144 ; voir aussi Formule 
(en Mathématiques), Métho¬ 
de (en Mathématiques). 

Cardinal -d'un ensemble : 

18 ; — infini : 25. 

Cardioïde - 154. 

Carré 145. 

Cartan (Élie Joseph), 1869- 

1951, mathématicien fran¬ 
çais - 6, 36, 37, 77, 78, 106. 

Cartan (Henri Paul), 1904- 
mathématicien français - 6, 
36, 129. 

Cartésien - produit — : 15, 22. 
Casorati (Felice), 1835-1890, 
mathématicien italien - 125. 
Castelnuovo (Guido), 1865- 

1952, mathématicien italien 
-6. 

Catégorie (en Mathématiques) 

- 129. 

Cauchy (Augustin-Louis, ba¬ 
ron), 1789-1857, mathémati¬ 
cien français - 5, 6, 9, 12, 13, 
20, 33, 37, 53, 58, 73, 94, 
105, 107, 110, 119, 124, 127, 

129 ; voir aussi Condition (en 
Mathématiques), Critère, 
Plan (en Mathématiques), 


Règle (en Mathématiques) 
Suite (en Mathématiques). 

Cavaillès (Jean), 1903-1944, 
mathématicien et philoso¬ 
phe français - 1. 

Cavalieri (Francesco Bonaven- 
tura, dit aussi Cavalieri), v. 
1598-1647, mathématicien 
italien - 6, 11, 77, 102, 103. 

Cayley (Arthur), 1821-1895, 
mathématicien anglais - 12, 
37, 40, 47, 58, 59, 77, 94, 
128, 148; voir aussi Théorè- 

„ me (en Mathématiques). 

Cebysev (Pafnutij L'voviô), 
1821-1894, mathématicien 
russe - 6, 132. 

Cech (Eduard), 1893-1960, ma¬ 
thématicien tchèque - 129. 

Centre (en Géométrie)-de 

gravité d'un triangle : 145; 
— d'homologie : 77 ; — 
d'homothétie : 83. 

Cercle (en Mathématiques) - 4, 
145; — de courbure (= — 
osculateur) : 124; — d'in¬ 
version : 149, 150; —direc¬ 
teur d'une ellipse : 150 ; me¬ 
sure du — : 4 ; — oscula¬ 
teur (= — de courbure) : 
124. 

Cesarô (Ernesto), 1859-1906, 
mathématicien italien - 105. 

Chaîne (en Topologie)-à n 

dimensions : 130. 

Chaînette (en Géométrie) - 
154. 

Champ (en Mathématiques) - 
—s de vecteurs : 129. 

Chasles (Michel), 1793-1880, 
mathématicien français - 1, 
6, 77 ; voir aussi Relation (en 
Mathématiques). 

Chern (Shiing-Shan), 1911- 
, mathématicien chinois, 
naturalisé américain en 1961 
-6, 78, 124. 

Chevalley (Claude), 1909- 
mathématicien français - 6, 
36, 78. 

Christoffel (Elwin Bruno), 
1829-1900, mathématicien 
allemand-6, 58, 66, 78, 124. 

Chuquet (Nicolas), 1445-1500, 
mathématicien français - 5, 
10. 

Circonscrit - cercle — : 145. 

Cissoïde — de Dioclès ; 154. 

Clairaut (Alexis-Claude, dit aus¬ 
si Clairault), 1713-1765, ma¬ 
thématicien français - 5, 6, 
94, 104; voir aussi Équation. 

Classe d'équivalence (en Ma¬ 
thématiques) - 17; addition 
des —s ; 44 ; — dans un 
groupe : 41 ; — dans I : 
17, 29; multiplication des 
—s : 44. 

Classe résiduelle - 29, 30. 

C LA VIS MATHEMATICAE 

(Clef pour les Mathémati¬ 
ques), traité de mathémati¬ 
ques de William Oughtred, 
1631 - 103. 

Clebsch (Rudolph Friedrich Al¬ 
fred), 1833-1872, mathémati¬ 
cien allemand - 6, 58, 77, 78, 
94, 105. 

Clifford (William Kingdon), 
1845-1879, mathématicien 
anglais - 12, 58, 77. 

Coefficient - — angulaire : 
110, 112; — directeur : 
100; — d'un monôme : 
141 ; matrice des —s ; 64. 

Cohen (Paul Joseph), 1934- 
, mathématicien améri¬ 
cain - 6. 

Cohomologie - 129. 

Colatitude - 96. 

Colinéarité - 76. 

Combinaison (en Mathémati¬ 
ques) - 34 ; — avec répéti¬ 
tion : 34, 35 ; nombre de 
—s : 24. 

Combinaison linéaire - 48. 

Commutativité - voir Algèbre 
(branche des Mathémati¬ 
ques), Algèbre (structure al¬ 
gébrique), Anneau (en Ma¬ 
thématiques); — de l'addi¬ 
tion dans : 25 ; — de la 
multiplication dans N 
25 ; — d'une loi de composi¬ 
tion interne : 37. 

Complément (d'un angle) - 
145. 

Complémentation - 16. 

Complexe (en Mathématiques) 

- corps des —s : 55 ; ensem¬ 
ble C des —s : 32 ; nombre 
-: 32, 52. 

Complexe (en Topologie (= 
polyèdre)) - 130. 


Composantes (en Mathémati¬ 
ques) - 47. 

Composé (en Mathématiques) 
-46. 

Comte (Auguste), 1798-1857, 
mathématicien et philoso¬ 
phe français -1. 

Conchoïde - — de Nicomè- 
de : 154. 

Condition (en Mathématiques) 

-s de Cauchy-Riemann : 

125. 

Cône (en Mathématiques) - 
146 ; — directeur d'une qua- 
drique : 154; — d'ombre : 
92. 

Congruence 24 ; — dans un 
anneau : 43 ; — dans un 
groupe : 42 ; — dans un 
monoïde : 42 ; propriétés 
des —s : 29 ; théorie des 
—s : 28. 

Conique - 88, 146; voir aussi 
Courbe (en Mathémati¬ 
ques) ; — à l'infini : 154; 
équation des —s : 153, 154 ; 
normales aux —s : 154. 
Conjugué (en Mathématiques) 

— matrice —e : 64 ; nombres 
complexes—s : 142; points 
—s par rapport à un cercle : 
148. 

Conjugués harmoniques 

146. 

Connexité (en Topologie) -131. 
Continu - puissance du — : 19. 

Continuité 110. 

Contour apparent-d'une 

surface ; 92. 

Convergence (en Mathémati¬ 
ques) - critères de — : 105 ; 

— d'une intégrale : 122 ; — 
d'une série ; 119, 124, 157; 

— uniforme : 119. 

Coordonnées-barycentri- 

ques : 83, 96 ; — cartésien¬ 
nes : 22, 95 ; — curvili¬ 
gnes : 78 ; — cylindriques ; 
96 ; — d'un point : 75, 95 ; 

— homogènes : 94, 152 ; — 
polaires : 95; — sphéri¬ 
ques : 96. 

Corps (en Mathématiques) - 
42 ; — p-adiques : 37 ; ca¬ 
ractéristique d'un — : 45 ; 

— commutatif : 43 ; — des 
complexes : 55 ; — des sé¬ 
ries formelles : 37 ; — finis : 
37, 44 ; — modulaire : 45 ; 

— non commutatif : 43 ; — 
non modulaire : 45 ; proprié¬ 
tés des — : 45; structure 
de — : 43. 

Corrélation (en Géométrie pla¬ 
ne) - 153. 

Correspondance (en Mathé¬ 
matiques) - 2 ; — biunivo- 
que : 18, 21 ; — projecti¬ 
ve : 88. 

Cosécante - 90. 

Cosinus - 90 ; — hyperboli¬ 
que : 118. 

Cotangente - 90, 118. 

Cote (en Géométrie) - 91. 

Cotes (Roger), 1682-1716, as¬ 
tronome et mathématicien 
anglais - 53. 

Cotton (Émile), 1872-1950, ma¬ 
thématicien français - 78. 
Coupure (dans un ensemble) - 
53. 

Courbe (en Mathématiques) - 
aire d'une — : 122; — 
asymptotique : 124; — de 
Gauss : 154 ; équation d'une 

— : 99 ; — exponentielle : 
154; — logarithmique 
154; longueur d'un arc de 

— ; 122; — mécanique : 

4 ; propriétés des —s pla¬ 
nes 152 ; rectification 
d'une — : 122 ; —s du se¬ 
cond ordre (= coniques) : 
153. 

Courbure - 66, 153 ; cercle de 

— (= cercle osculateur) : 

124 ; lignes de — : 124 ; — 
normale : 124;*rayon de 

— : 153. 

Couronne (en Mathématiques) 

— 146. 

Cramer (Gabriel), 1704-1752, 
mathématicien suisse - 5, 6, 
12, 33, 37, 58, 76, 78, 94. 
Cremona (Antonio Luigi Gau- 
denzio, dit Luigi), 1830-1903, 
mathématicien italien - 6, 77, 
78, 94., 

Crible d'Ératosthène - 25, 26, 

27. 

Critère-de Cauchy : 53, 

107, 109, 157; —s de con¬ 
vergence : 105. 

Cube - 146. 
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Cycle (en Topologie) -131. 
Cycloïde (= roulette) - 103, 
154. 

Cylindre (en Mathématiques) - 
4, 146 ; — d’ombre : 92 ; — 
parabolique : 154. 


D 

Dal Ferro (Scipione) - voir Sci- 
pione dal Ferro. 

Darayagaus - voir Darius. 
Darboux (Jean-Gaston), 1842- 
1917, mathématicien fran¬ 
çais - 6, 78, 105, 119, 124. 
Dareios - voir Darius. 

Darius I er (en grec : Dareios, 
en vieux perse : Darayagauè), 
521-486 av. J.-C., roi de Per¬ 
se - 4. 

Décagone - 146. 
Décomposition (en Mathéma¬ 
tiques) -du groupe abé- 

lien selon son sous-groupe : 
41 ; — d’une fraction ration¬ 
nelle en éléments simples : 
70 ; — d’un groupe suivant 
son sous-groupe : 41 ; — 
d’un nombre en facteurs pre¬ 
miers : 139. 

Dedekind (Julius Wilhelm Ri¬ 
chard, dit Richard), 1831- 
1916, mathématicien alle¬ 
mand - 5, 6, 12, 13, 19, 30, 
36, 41, 43, 50, 53, 54, 105, 
128. 

Définition (en Mathématiques) 

— domaine de — (= ensem¬ 
ble de départ) : 20, 109. 

Degré (en Mathématiques) — 
d’un polynôme : 66 ; — d’un 
polynôme non nul : 67. 
Degré (en Trigonométrie) - 89. 
DE LUDO ALEAE (Du jeu de 
hasard), traité posthume de 
Cardan, fin du XVI e s. - 132. 
Demi-droite - 79 ; — fermée : 
79. 

Demi-plan - 146. 

De Morgan (Augustus), 1806- 
1871, mathématicien anglais 

— 13, 15, 22, 128, 129. 
Dénominateur - 31, 140; ré¬ 
duction au même — : 140. 

Densité de probabilité 133. 
Déplacement (en Mathémati¬ 
ques) - groupe des —s ; 73 ; 

— dans l’espace : 149. 
Dérivation - formules de — : 

114. 

Dérivée - 113, 119 ; — aérolai- 
re : 125; applications des 
—s : 115 ; calcul des —s : 
114; définition de la — 
d’une fonction : 113, 114; 

— des fonctions circulaires : 
114 ; — des fonctions usuel¬ 
les : 114; — d’ordre n : 

115, 119 ; — d’une fonction 
de variable complexe : 125 ; 

— d’une fonction inverse : 
114; invention des —s : 
113; — logarithmique 

114 ; —s des fonctions hy¬ 
perboliques : 156 ; — secon¬ 
de : 115, 116; signification 
géométrique de la — : 113 ; 
—s partielles : 118 ; —s par¬ 
tielles successives : 156; 
—s successives : 115 ; — 
sur un intervalle : 114; — 
totale : 118. 

Desargues (Gérard ou Gas¬ 
pard), 1593-1662, ingénieur 
et mathématicien français - 
5, 6, 77, 87, 152. 

Descartes (René), 1596-1650, 
philosophe, mathématicien 
et physicien français -1,4, 
5, 6, 10, 11, 12, 14, 20, 75, 
78, 93, 94, 103, 113, 129; 
voir aussi Théorème (en Ma¬ 
thématiques). 

Déterminant (en Mathémati¬ 
ques) - 12, 32, 37, 58, 59; 
calcul des —s : 59, 143 ; — 
d’une matrice : 60 ; élé¬ 
ments du — : 58 ; ordre 
d’un — : 58, 59 ; théorie 
des —s : 58. 

Développement (en Analyse) - 

— des fonctions usuelles 
(sin x, cos x, e x , a x , etc.) : 
155 ; —s en série : 155. 

Développement (d’une surfa¬ 
ce) - 146. 

Diagonale-d’un polygone 

ou d’un polyèdre : 146; ma¬ 
trice — : 60 ; — principale : 
59, 60. 

Diagramme — de Venn : 15. 

Diamètre-d’un cercle ou 

d’une sphère : 146. 

Dickson (Leonard Eugene), 
1874-1954, mathématicien 
américain - 25, 32, 46. 
Dièdre - 146. 

Dieudonné (Jean Alexandre 
Eugène, dit Jean), 1906- 
mathématicien français -128. 
Différentielle - 119; — binô¬ 
me : 158; calcul des —s ; 
119; définition de la — 
d’une fonction : 119; signi¬ 
fication géométrique de la 

— : 119; — totale : 157. 
Dilatation (en Mathématiques) 

— 76, 83. 

Dimension d'un vecteur - 47. 
Dini (Ulisse), 1845-1918, ma¬ 
thématicien italien - 47. 
Diophante (Diophantos), v. 
315-410, mathématicien 


grec - 1, 3, 4, 5, 8, 9, 11, 33, 
52, 69, 137. 

Diophantos - voir Diophante. 

Direction (en Géométrie) - 80, 
108; —s principales : 124. 

Directrice-d'une surface 

conique (Conique) : 146. 

Dirichlet (Peter Gustav Lejeu¬ 
ne), 1805-1859, mathémati¬ 
cien allemand - 6, 12, 20, 24, 
27, 105; voir aussi Théorè¬ 
me (en Mathématiques). 

Discontinuité - 110; — de 
deuxième espèce : 111 ; — 
de première espèce : 111 ; 

— régulière : 111. 

Discriminant - 32. 

Disjoint - ensembles —s : 16. 

Disque (en Mathématiques) - 

118. 

DISQUISITIONES ARITHME- 
TICAE (Recherches arithmé¬ 
tiques), œuvre de K.-F. 
Gauss, 1801 - 24, 28. 

Distance-dans un espace 

métrique : 106 ; — en géo¬ 
métrie élémentaire : 146. 

Distributivité — d'une loi de 
composition externe : 37. 

Dividende - 141. 

Diviseur - 25 ; — de zéro ; 42, 
63. 

Divisibilité - caractères de 

— : 139, 140. 

Division (en Mathématiques) - 

— des fractions : 140; — 
des fractions rationnelles : 
70, 142; — des nombres 
entiers : 25 ; — des nom¬ 
bres relatifs : 141 ; — eucli¬ 
dienne des polynômes : 68. 

DOCTRINE OF CHANCES (La 
doctrine des chances), traité 
de A. de Moivre, 1718-132. 

Dodécagone - 146. 

Domaine (en Mathématiques) 
-de définition (= ensem¬ 
ble de départ) : 20, 109 ; — 
des valeurs (= ensemble 
d'arrivée) : 20, 109; —d'in¬ 
tégrité : 42 ; — d'opérateur 
(d'une loi de composition 
externe) : 37 ; — d'opéra¬ 
teurs : 48. 

Doob (Joseph Léo), 1910- 
mathématicien américain - 6. 

Drach (Jules), 1871-1949, ma¬ 
thématicien français - 106. 

Droite-à l'infini : 76, 87, 

152 ; — de bout : 92 ; — de 
front : 92 ; — de profil : 
92 ; — de Simson (Simson) : 
147; — d'Euler (Orthocen¬ 
tre) : 146 ; épure d'une — : 
92 ; équation de la — dans le 
plan et dans l'espace ; 151, 
152, 153 ; faisceaux de —s : 
88 ; —s perpendiculaires : 
85 ; structure de la — : 82 ; 

— verticale : 92. 

Droite numérique (= ensem¬ 
ble des réels) - 19, 54, 107; 
topologie générale de la — : 
129, 130. 

Duale - 88. 

Dualité - principe de — : 77, 
87. 

Duhamel (Jean-Marie Cons¬ 
tant), 1797-1872, mathémati¬ 
cien français - voir Règle (en 
Ma thé ma tiques). 

Dupin (François Pierre Charles, 
baron), 1784-1873, homme 
politique et mathématicien 
français - 94, 124. 

Durer (Albrecht), 1471-1528, 
graveur et peintre allemand - 
77. 

Dyck (Walther Franz Anton 
von), 1856-1934, mathémati¬ 
cien allemand - 129. 

Dynkin (Evgenij Borisoviô), ma¬ 
thématicien soviétique con¬ 
temporain - 6. 


E 

ç - le nombre — : 155. 

Écart-moyen - 133. 

Écart-type - 133. 

Ecole (en Mathématiques) — 
de Bagdad : 137; — de 
Marâga : 138; — de Tolè- 
, de : 137. 

Écolç (en Philosophie) - — 
, d'Elée : 8. 

Égalité (en Mathématiques) - 

— de deux ensembles : 15 ; 

— de deux vecteurs dans 
U 2 : 55. 

Ehresmann (Charles), 1905- 
, mathématicien fran¬ 
çais - 6, 78, 124. 

Eilenberg (Samuel), 1913- 
mathématicien américain 
d'origine polonaise - 6, 129 ; 
voir aussi Espace (en Ma¬ 
thématiques en général). 
Einstein (Albert), 1879-1955, 
physicien allemand, naturali¬ 
sé américain en 1940. Prix 
Nobel de Physique en 1921 - 
66. 

Eisenstein (Ferdinand Gott- 
hold Max), 1823-1852, ma¬ 
thématicien allemand - 32. 
Élément (en Mathématiques) - 

— absorbant (à droite et/ou à 
gauche) : 38 ; — idempo- 
tent : 38 ; — neutre de la 
multiplication dans : 25 ; 

— neutre pour l'addition 
dans : 25 ; — neutre 


(pour une loi de composition 
interne) : 37 ; — régulier (à 
droite et/ou à gauche) : 38 ; 
—s à l'infini : 152; —s dia¬ 
gonaux de la matrice : 60 ; 
—s diagonaux ; 59 ; —s d'un 
ensemble : 15; —s imagi¬ 
naires : 152 ; —s isotropes : 

152 ; —s opposés : 37 ; —s 
symétriques : 37 ; — symé¬ 
trique (à droite et/ou à gau¬ 
che) : 37 ; — unit,é : 3Ç. 

ÉLÉMENTS DE GEOMETRIE , 
œuvre d'Euclide, III e s. av. 
J.-C. -4, 7, 8, 75, 148. 

Ellipse 150. 

Ellipsoïde -154 ; — imaginaire. 

, réel : 154. 

Eloignement (en Mathémati¬ 
ques) - 91, 92. 

Endomorphisme - 38. 

Enestrôm (Gustav Hjalmar), 
1852-1923, mathématicien 
suédois -1. 

Enneper (Alfred), 1830-1885, 
mathématicien allemand - 78, 
124. 

Enriques (Federigo), 1871- 
1946, mathématicien italien 

— 6, 78. 

Ensemble (en Mathématiques) 

— cardinal d'un — : 18 ; — C 
des complexes : 32 ; cons¬ 
truction de I'— Z : 28 ; — 
convexe : 80 ; — d'arrivée 
(= domaine des valeurs) : 
20, 109; — de départ ( = 
domaine de définition) : 20, 
109; — dérivé : 128 ; — 
des parties (= booléen) : 
15; — des réels (= droite 
numérique) ; 19, 31, 54, 
107; — des substitutions : 
39, 40 ; éléments d'un — : 
15; — fermé : 17; majo¬ 
rant d'un — : 18; minorant 
d'un — : 18 ; — N des en¬ 
tiers : 25 ; opération sur les 
—s : 15, 16 ; — ouvert (= 
ouvert) : 17, 18, 128; parti¬ 
tion d'un — : 15; partition 
d'un — fini : 36 ; propriétés 
de I'— I^J : 25 ; puissance 
d'un — : 18, 19 ; — Q des 
nombres rationnels : 31 ; — 
quotient ; 17 ; règles de cal¬ 
cul sur les —s : 16 ; —s : 7 ; 
—s dénombrables : 19; —s 
disjoints : 16; —s équipo- 
tents : 18, 19; —s finis : 
15; —s infinis : 15; —s 
paradoxaux : 13, 14; théo¬ 
rie des —s : 15 ; — vide : 
15; — Z des entiers rela¬ 
tifs : 27 ; — Un : 44. 

Entier — algébrique : 32 ; — 
complexe : 32 ; généralisa¬ 
tion de la notion d'— : 32 ; 

— naturel : 25, 28, 32, 52 ; 

— négatif : 28 ; — positif : 
28 ; - relatif ; 28, 32. 

Enveloppe (en Mathémati- 

, ques) - 146, 153. 

Épimorphisme - 50. 

Épreuves répétées (en Théo- 

, rie des probabilités) - 133. 

Épure - 91 ; — d'un plan : 92 ; 

— d'un point : 91, 92. 

Équateur (en Géométrie analy¬ 
tique) - 96. 

Équation — algébrique : 70 ; 

— barycentrique du plan : 
101 ; — cartésienne d'une 
droite : 100; — d'al-Màhâ- 
nï : 137 ; — de Bernoulli : 
160 ; — de Clairaut : 160 ; 

— de la droite dans le plan et 
dans l'espace : 152, 153; 

— de la droite en coordon¬ 
nées polaires : 152 ; — des 
coniques, en coordonnées 
cartésiennes et en coordon¬ 
nées polaires : 153, 154 ; — 
différentielle : 11 ; — diffé¬ 
rentielle du premier ordre, 
du second ordre, linéaire : 
123; — diophantienne : 5; 

— du cercle : 154 ; — d'une 
courbe : 99 ; — du n-ième 
degré : 71, 72 ; — du plan : 
151 ; — du premier degré à 
une inconnue : 71 ; — du 
quatrième degré : 72, 144; 

— du second degré : 71, 72, 
144; — du troisième de¬ 
gré : 72, 144; — normale 
de la droite : 152 ; — nor¬ 
male du plan : 152 ; racines 
(= solutions) d'une — : 70, 
71 ; résolution des —s diffé¬ 
rentielles : 105, 123, 159; 
résolution d'une — : 71 ; 
—s barycentriques de la droi¬ 
te : 100; —s différentiel¬ 
les : 123 ; —s différentiel¬ 
les du premier ordre : 123, 
159; —s différentielles du 
second ordre : 123, 160; 
—s différentielles homogè¬ 
nes, linéaires : 123, 159, 
160; solutions (= racines) 
d'une — : 70, 71 ; —s trigo- 
nométriques : 91, 151. 

Équilatéral - triangle — : 146. 

Equipollence - relation d'— : 

, 50, 85. 

Équipotence - relation d'— : 

, 18. 

Equivalence (en Mathémati¬ 
ques) - relation d'— : 17, 18, 
19, 50, 85 ; voir aussi Classe 
d'équivalence (en Mathéma¬ 
tiques). 

Ératosthène (Eratosthenès), v. 


284-v. 192 av. J.-C., géogra¬ 
phe et mathématicien alexan¬ 
drin - 25, 26 ; voir aussi Cri¬ 
ble d'—. 

Eratosthenès voir Eratos- 
thène. 

Erdôs (Pal), 1913- , mathé- 

_ maticien hongrois - 6, 25. 

’Eron - voir Héron d'Alexandrie. 

Errera (Alfred), 1886-1960, ma- 
thémaciticn contemporain - 
6. 

Espace (en Mathématiques en 
général) - 123 ; — affine : 
82; — complet : 106; — 
connexe : 131 ; — de Ba- 
nach : 47, 106; — d'Eilen- 
berg-Maclane 129; — 
fibré : 129; H-— : 129; — 
hilbertien : 47 ; — métri¬ 
que : 47, 85, 106; — pro¬ 
duit tensoriel : 66 ; — topo¬ 
logique : 127, 131 ; —vecto¬ 
riel : voir Espace vectoriel 
(en Algèbre); — vectoriel 
normé ; 47, 106. 

Espace vectoriel (en Algèbre) - 
20, 46 ; — à une dimension 
20 ; définition d'un — : 47 ; 

— des fonctions continues : 
47 ; — n-dimensionnel : 48 ; 
dimensions d'un — : 49 ; 
morphisme d'— : 50 ; — 
quotient : 49, 50 ; structure 
d'— du plan pointé : 83, 84 ; 

— sur le corps IR des réels : 
48. 

Espérance mathématique - 

133. 

Euclide (Eukleidês), III e s. av. 
J.-C., mathématicien grec - 

I, 4, 5, 7, 8, 9, 10, 11, 14, 24, 
25, 52, 75, 77, 83, 137, 148; 
voir aussi Axiome, Géomé¬ 
trie, Postulat, Repère (en Ma¬ 
thématiques). 

Eudème de Rhodes (Eudé- 
mos), v. 300 av. J.-C., philo¬ 
sophe grec -1. 

Eudëmos : voir Eudème de 
Rhodes. 

Eudoxe de Cnide (Eudoxos), v. 
406-v. 355 av. J.-C., astro¬ 
nome, mathématicien et phi¬ 
losophe grec - 4, 5, 9, 11, 24, 
52, 102. 

Eudoxos - voir Eudoxe. 

Eukleidês - voir Euclide. 

Euler (Leonhard), 1707-1783, 
mathématicien suisse - 5, 6, 

II, 12, 20, 24, 27, 30. 33, 
36, 53, 76, 78, 89, 94, 104, 
106, 124, 127, 128, 129; 
voir aussi Droite, Formule 
(en Mathématiques), Identi¬ 
té (en Mathématiques), 
Théorème (en Mathémati- 
ques). 

Événement (en Mathémati¬ 
ques) -aléatoire : 132 ; 

—s indépendants : 133. 

Exhaustion - méthode par 

— ; 102. 

Exinscrit - cercle — ; 146. 

Exponentiel - fonction — le : 
112; loi — le : 134. 

Exposant - 141 ; — fraction¬ 
naire : 141. 

Expression (en Mathémati¬ 
ques) — algébrique (entière 
ou fractionnaire, rationnelle 
ou irrationnelle) : 141 ; —s 
symétriques : 72. 

Extension - 45, 46. 

Extrêmes-d'une propor¬ 

tion : 140. 

Extrémum — d'une fonc¬ 
tion : 115, 116. 


F 

Facteur (en Mathématiques) - 
—s premiers : 139, 140. 

Factorisation — d'un polynô¬ 
me : 69 ; — du trinôme du 
second degré : 144. 

Fagnano dei Toschi e di Sant' 
Onofrio (Giulio Cesare), 
1682-1766, mathématicien 
italien -104. 

Faisceau (en Mathématiques) - 

— de cercles : 148; — de 
droites : 88. 

Fëdorov (Vladimir Dmitrieviô), 
1893- , mathématicien 

soviétique : 125. 

Fermât (Pierre de), 1601-1665, 
mathématicien français : 1, 
5, 6, 11, 24, 27, 33, 75, 
93,113 132 ; voir aussi Fonc¬ 
tion (en Mathématiques), 
Théorème (en Mathémati¬ 
ques). 

Fermé (en Topologie) - 129, 
130. 

Ferrari (Ludovico), 1522-1565, 
mathématicien italien - 5, 11, 
12, 72; voir aussi Méthode 
(en Mathématiques). 

Ferrers (Norman Macleod), 
1829-1903, mathématicien 
anglais - 33. 

Fibonacci (Leonardo) - voir Léo¬ 
nard de Pise. 

Figure (en Mathématiques) - 

— plane : 76. 

Fischer (Ernst Sigismund), 
1875-1959, mathématicien 
autrichien - 132. 

Fluente - 104. 

Fluxion - 104. 

Folium de Descartes - 154. 

Fonction (en Mathématiques) - 


20 ; — algébrique : 110 ; — 
analytique (= — régulière) : 
114, 115, 126 ; — caractéris¬ 
tique : 133; — circulaire ; 
90, 91, 110, 117 ; — compo¬ 
sée : 110; — continue : 

110, 111 ; — de Fermât : 
27 ; — de Mersenne : 27 ; 

— de plusieurs variables : 
118, 156, 157 ; — de réparti¬ 
tion : 133; — dérivable : 
110 ; dérivée des —s circulai¬ 
res : 114; dérivée d'une — 
f (z) pour z complexe : 125 ; 
dérivée d'une — inverse : 
114 ; — d'une variable com¬ 
plexe : 124, 125; — d'une 
variable réelle : 109, 110, 
155; — en escalier : 113, 
120 ; — exponentielle : 112, 
117; extrémum d'une — : 

111, 115, 157; — factorielle 
n : 33 ; — holomorphe : 
125 ; — homogène : 156 ; 

— homographique : 110; 

— implicite : 156 ; — inver¬ 
se : 110 ; — linéaire : 110, 
111, 112 ; — linéaire com¬ 
plexe : 126; — logarithme : 
112; — logarithme népé¬ 
rien : 116; maximum d'une 

— : 111, 115, 116; métho¬ 
de des « —s majorantes » : 
105; minimum d'une — : 
111, 115, 116; — monogè¬ 
ne : 125; — monotone : 
110; — multivoque : 110; 

— numérique : 48, 109, 110, 
111, 155; — périodique ; 
112 ; — polygène : 125 ; — 
puissance : 116 ; — ration¬ 
nelle : 110, 111 ; — récipro¬ 
que : 110; — régulière (= 

— analytique) : 125 ; —s cir¬ 

culaires : 110, 112, 117; 
—s circulaires inverses (ou 
réciproques) 117, 151, 

156 ; —s de Sturm : 73 ; 
—s elliptiques : 105, 110; 
—s hyperboliques : 118, 
156 ; —s hyperboliques réci¬ 
proques : 118; —s inver¬ 
ses : 21 ; —s kleinéennes : 
105; —s multivoques 
126; —s numériques : 20; 
—s 0-fuchsiennes : 105; 
—s w = 1/z, w = z n , w = e z 
pour z complexe : 126; 
théorème des —s compo¬ 
sées : 114 ; — thêta (ou — 
0) : 105 ; — transcendante ; 
110 ; — trinôme : 112 ; — 
univalente, multivalente 

125 ; — univoque : 110 ; va¬ 
riation des —s : 115 ; — 
vectorielle : 20, 109 ; — y = 
1/x : 112; — zêta : 27. 
Forme (en Mathématiques) - 

— algébrique : 58, 64 ; — 
canonique : 65 ; — équiva¬ 
lente : 64 ; — linéaire : 64, 
65 ; — normale ; 65 ; — 
quadratique : 24, 32, 64, 65 ; 

— quadratique définie : 32 ; 

— quadratique définie positi¬ 
ve : 32 ; — quadratique posi¬ 
tive : 65, 66 ; —s différen¬ 
tielles quadratiques : 124 ; 

— ternaire : 64, 65. 

Formule (en Mathématiques) - 

— de Cardan : 11, 144; — 
de MacLaurin : 115, 117; 

— de Moivre : 53, 142; — 
de Poisson : 132; — de 
Stirling : 33, 119 ; — de Tay¬ 
lor : 115, 124 ; — du carré 
du binôme (a + b) : 24 ; —s 
d'addition des arcs : 150; 
—s d'addition et de transfor¬ 
mation des fonctions hyper¬ 
boliques : 156; —s de déri¬ 
vation ; 114 ; —s de Fourier- 
Euler : 157 ; —s de transfor¬ 
mation (en Trigonométrie) : 
150; —s d'Euler : 91, 129, 
143. 

Fourier (Jean-Baptiste Joseph, 
baron), 1768-1830, mathé¬ 
maticien français - 6, 105; 
voir aussi Formule (en Ma¬ 
thématiques), Série (en Ma¬ 
thématiques). 

Foyer (en Mathématiques) - 
—s d'un conique : 150. 
Fractile d'ordre p - 133. 
Fraction - 44, 45 ; — algébri¬ 
que : 31 ; calcul sur les —s : 
140; — décimale : 24; dé¬ 
composition d'une — ration¬ 
nelle en éléments simples : 
70; — irréductible : 140, 
142 ; — rationnelle : 69, 70, 
142; réduction des —s au 
même dénominateur : 140; 
simplification des —s : 140 ; 
simplification des —s ration¬ 
nelles : 69, 70. 

Fraenkel (Adolf Abraham Hale- 
vi, dit Abraham), 1891-1965, 
mathématicien israélien d'o¬ 
rigine allemande - 14. 
Fréchet (Maurice René), 1878- 
1973, mathématicien fran¬ 
çais - 106, 128. 

Fredholm (Erik Ivar), 1866- 
1927, mathématicien sué¬ 
dois - 47. 

Frege (Friedrich Ludwig Got- 
tlob), 1848-1925, mathémati¬ 
cien et philosophe allemand 
-6, 13. 

Frères de la Pureté - voir as- 
Safa. 

Frobenius (Ferdinand Georg), 


1849-1917, mathématicien 
allemand - 43. 

Fubini (Ghirin Guido), 1879- 
1943, mathématicien italien 
-78, 124. 

Fuchs (Lazarus), 1833-1902, 
mathématicien allemand - 58, 
105. 

Fuseau (en Mathématiques) - 
— sphérique : 146. 


G 

Gàbir b. Aflah (Abü Muham¬ 
mad connu sous le nom de 
Geber de Séville), Xl e -Xll e s., 
astronome et mathémati¬ 
cien arabe - 89. 

Galilée (Galileo Galilei, dit), 
1564-1642, astronome et 
physicien italien - 13, 102; 
voir aussi Paradoxe. 

Galilei (Galileo) - voir Galilée. 

Galois (Évariste), 1811-1832, 
mathématicien français - 3, 
5, 6, 12, 24, 30, 33, 36, 39, 
41, 72, 76, 105. 

Galton (Sir Francis), 1822- 
1911, naturaliste et statisti¬ 
cien français - 6. 

Gauche (en Mathématiques) - 
surface — : 146. 

Gauss (Cari Friedrich), 1777- 
1855, mathématicien, astro¬ 
nome et physicien allemand 

— 5, 6, 12, 24, 25, 28, 30, 32, 
33, 36, 43, 46, 52, 53, 58, 
72, 73, 78, 104, 105, 124, 
127, 128, 129, 132, 134, 
144 , 148; voir aussi Loi (en 
Mathématiques), Théorème 
(en Mathématiques). 

Geber de Séville - voir Gàbir b. 
Aflah/51. 

Gel'fand (Izrail’ Moiseevic), 
1913- , mathématicien 

soviétique - 47. 

Geminos - voir Geminos de 
Rhodes. 

Geminos de Rhodes (en la¬ 
tin : Geminus ; en grec : 
Geminos), I er s. av. J.-C., 
astronome et mathémati¬ 
cien grec - 1. 

Geminus - voir Geminos de 
Rhodes. 

Générateur (en Mathémati¬ 
ques) — d'un groupe : 41. 

Génératrice - 88 . 

Gentzen (Gerhard Karl Erich), 
1909-1945, mathématicien 
allemand -14. 

Géodésique - 78, 124 ; inva¬ 
riant — : 124. 

GEOMETRIA INDIVISIBILI- 
BUS CONTINUORUM NO¬ 
VA QU AD AM RATIONE 
PROMOT A - voir Géométrie 
des indivisibles. 

Géométrie - 75 ; — affine : 
76 ; — affine de la droite : 
82 ; — affine du plan : 84, 
85; — algébrique : 12, 37, 

77, 78 ; — analytique : 5, 
93 ; axiomes de la — plane : 

78, 79; — cotée : 91, 92; 
définition de la — : 76 ; — 
descriptive : 5, 77, 91, 92; 

— des groupes continus fi¬ 
nis : 78 ; — différentielle : 
78, 123; — élémentaire : 
78, 145; —elliptique : 77; 

— euclidienne : 4, 76, 130, 
148; — euclidienne dans 
l'espace : 86 ; — hyperboli¬ 
que : 77 ; — infinitésimale : 
5, 78, 123; invention de la 

— analytique : 11 ; — métri¬ 
que : 76 ; — métrique du 
plan ; 85 ; — non euclidien¬ 
ne : 5, 76, 77, 88, 148; 
objet de la — descriptive : 
91 ; — plückerienne : 94 ; 

— projective : 76, 77, 87 ; 

— projective différentielle : 
78; — riemanienne : 124; 
—s cgrtaniennes : 77. 

GÉOMÉTRIE DES INDIVISI¬ 
BLES (Geometria Indivisibili- 
bus Continuorum Nova Qua- 
dam Ratione Promota), œu¬ 
vre de Cavalieri -102. 

Gérard de Crémone (Gherar- 
do da Cremona, dit en fran¬ 
çais), 1114-1187, traducteur 
italien - 9, 137. 

Gergonne (Joseph Diez), 1771- 
1859, mathématicien fran¬ 
çais - 53, 77, 88, 129. 

Germain (Sophie), 1776-1831, 
mathématicienne française - 
24, 27. 

Gherardo da Cremona - voir 
Gérard de Crémone. 

Gibbs (Josiah Willard), 1839- 
1903, physicien américain - 
66. 

Girard (Albert), v. 1595-1632, 
ingénieur et mathématicien 
néerlandais d'origine françai¬ 
se - 5, 6, 12, 33, 72, 144. 

Godeaux (Lucien), 1887- 
mathématicien belge - 78, 
124. 

Gôdel (Kurt), 1906-1978, logi¬ 
cien et mathématicien améri¬ 
cain - 5, 6, 14; voir aussi 
Théorème (en Mathémati¬ 
ques). 

Goldbach (Christian), 1690- 
1764, mathématicien alle¬ 
mand - 32 ; voir aussi Problè¬ 
me. 


Gonseth (Ferdinand), 1890- 
1975, mathématicien et phi¬ 
losophe suisse - 14. 

Gôpel (Adolf), 1812-1847, ma¬ 
thématicien allemand - 105. 

Gordan (Paul Albert), 1837- 
1912, mathématicien alle¬ 
mand - 58, 105. 

Goudin (Mathieu Bernard), 
1734-1817, mathématicien 
français - 94. 

Goursat (Édouard Jean-Baptis¬ 
te), 1858-1936, mathémati¬ 
cien français - 105, 125. 

Grade (en Trigonométrie) - 89. 

Gradient - 156. 

Graphe - 22 ; — d'une applica¬ 
tion : 22 ; — d'une corres¬ 
pondance : 22 ; — d'une 
fonction numérique : 22 ; — 
d'une relation : 22. 

Graphique - — d'une fonc¬ 
tion : 110, 111. 

Grassmann (Hermann Günt- 
her), 1809-1877, linguiste et 
mathématicien allemand - 6, 
12, 13, 37, 46, 47, 78. 

Greenberg (Marvin J.), mathé¬ 
maticien américain contem¬ 
porain - 131. 

Gregory (James), 1638-1675, 
astronome et mathémati¬ 
cien écossais - 103. 

Groupe (en Mathématiques) - 

39 ; voir aussi Semi-groupe, 
Sous-groupe ; — additif : 

40 ; — continu : 36 ; décom¬ 
position du — abélien selon 
son sous-groupe : 41 ; dé¬ 
composition d'un — suivant 
son sous-groupe : 41 ; — de 
transformations : 149; — 
d’homologie : 131 ; — fini ; 
36 ; — fini d'ordre n : 40 ; 
— multiplicatif : 40 ; — pro¬ 
jectif : 76, 87 ; — quotient : 

41 ; structure de — : 40 ; — 
structurel de la géométrie 
affine de la droite : 83 ; — 
symétrique d'un ensemble : 
40 ; théorie des —s de subs¬ 
titutions : 73. 

Guthrie (Francis), 1833-1886, 
mathématicien anglais - 129. 


H 

Hadamard (Jacques Salomon), 
1865-1963, mathématicien, 
français : — 6, 14, 25, 27,’ 
105. 

Hahn (Hans), 1879-1934, ma¬ 
thématicien allemand - 47. 

Haken (Wolfgang R. G.), ma¬ 
thématicien américain con¬ 
temporain - 6, 129. 

Hamilton (Sir William Rowan), 

1805-1865, astronome et ma¬ 
thématicien irlandais - 12, 
22, 30, 37, 43, 44, 46, 53, 
58, 60. 

Hankel (Hermann), 1839-1873, 
mathématicien allemand -13, 
105. 

Haraqi (al-, Muhammad b. 
Ahmad), ?-1138 ou 1139, 
mathématicien arabe - 137. 

Hardy (Godfrey Harold), 1877- 
1947, mathématicien anglais 
-32. 

H w Arizmï (al-, Muhammad 
b. Müsâ), fin du VIII e s.-dé- 
but du IX e s., mathématicien 
arabe - 5, 9, 24, 137. 

Harizmï (al-) - voir H w ârizmï 
(al-). 

Harmonique (en Mathémati¬ 
ques) - division — : 146; 
faisceau — : 146; relation 
— : 146. 

Haroun al-Rachid voir Hârün 
ar-Raèïd. 

Harrani (al-, lâbit b. Qurra), v. 
826-901, astronome et ma¬ 
thématicien arabe - 137. 

Harün ar-Rasïd, 766-809, Cali¬ 
fe abbaside : — 137. 

Hasse (Helmut), 1898- , ma¬ 

thématicien allemand : — 
32. 

Hauptvermutung - 129. 

Hausdorff (Félix), 1868-1942, 
mathématicien allemand - 
129 ; voir aussi Théorème 
(en Mathématiques). 

Hauteur (en Géométrie)-s 

d'un triangle — 146. 

Hazin (al-, Abü 6a c far), ?-v. 
965, astronome et mathéma¬ 
ticien iranien - 137. 

Heaviside (Oliver), 1850-1925, 
mathématicien et physicien 
anglais - 66. 

Heawood (Percy John), 1961- 
, mathématicien améri¬ 
cain - 6. 

Heilbronn (Hans Arnold), 1908- 
1975, mathématicien alle¬ 
mand - 32. 

Helmholtz (Hermann Ludwig 
Ferdinand von). 1821-1894, 
physicien et physiologiste al¬ 
lemand - 94. 

Hensel (Kurt), 1861-1941, ma¬ 
thématicien allemand - 37. 

Hermite (Charles), 1822-1901, 
mathématicien français - 6, 
24, 31, 47, 58, 73, 77, 105. 

Héron d'Alexandrie (’Érôn), 
I er s. ap. J.-C., mathémati¬ 
cien et mécanicien arec - 4. 

Hesse (Ludwig Otto), 1811- 
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1874, mathématicien alle¬ 
mand - 58, 94. 

Hexagone - 146. 

Heyting (Arend), 1898- 
mathématicien néerlandais - 
14. 

Hilbert (David), 1862-1943, ma¬ 
thématicien allemand - 6, 12, 
13, 14,41,43, 47, 53, 58, 60. 

Hipparque de Nicée (’lppar- 
hos), II e s. av. J.-C., astrono¬ 
me grec - 4, 89. 

Hisâb al-gubar (« calcul à la 
poussière »), type de calcul 
élémentaire utilisé par les 
mathématiciens arabes au 
XIII e s. - 138. 

Histoire des mathématiques 

-1, 6 ; — arabes : 5, 9, 137, 
138; — babyloniennes : 2, 
3 ; — chinoises : 3 ; — égyp¬ 
tiennes antiques : 3 ; — en 
Inde : 3 ; — grecques : 4. 

Hôlder (Ludwig Otto), 1859- 
1937, mathématicien alle¬ 
mand - 36. 

Holomorphe - fonction — : 
125. 

Homéomorphie - 127, 131. 

Homéomorphisme - 127, 128. 

Homogène (en Mathémati¬ 
ques) - coordonnées —s : 
94, 152; équations différen¬ 
tielles —s : 159; fonction 
— : 156; polynôme — : 
142. 

Homologie - 77, 129, 131 ; 
centre d'— : 77 ; groupe 
d'— : 131. 

Homothétie - 47, 48, 83 ; cen¬ 
tre d'— : 83 ; — dans le 
plan : 84, 149 ; — dans l'es¬ 
pace : 149. 

Homotopie - 129. 

Hopf (Heinz), 1894-1971, ma¬ 
thématicien allemand - 6, 
129, 130. 

Hugandï (al-, Hamid b. al- 
-Hidr), v. 1000, mathémati¬ 
cien arabe - 137. 

Hurewicz (Witold), 1904-1956, 
mathématicien américain - 6, 
129. 

Hurwitz (Adolph), 1859-1919, 
mathématicien suisse - 43. 

Husayn (al-, Muhammad b.), 
v. 1190, mathématicien ara¬ 
be - 137. 

Huygens (Christiaan, dit aussi 
Huyghens), 1629-1695, phy¬ 
sicien, mathématicien et as¬ 
tronome néerlandais - 6, 103, 
127, 132. 

Hyperbole - 150; — équilatè- 
re : 116, 154. 

Hyperboloïde — à deux nap¬ 
pes : 154 ; — de révolution 
à une nappe — 88, 154. 

Hypercomplexe - nombre — ; 
32. 

Hypocycloïde — à 4 rebrous¬ 
sements : 154. 

Hypoténuse - 146. 


I 

I (symbole défini par i 2 = — 1) 

- 56 ; signification géométri¬ 
que du symbole — : 57. 

IBN Abi r-Rigal (Abenragel 
chez les Occidentaux), v. 
1020/1040, mathématicien 
arabe - 137. 

IBN as-Soffâr, ?-1035, mathé¬ 
maticien arabe - 137. 

IBN as-Samh, 979 7-1035, ma¬ 
thématicien arabe - 137. 
Idéal — d'un anneau : 43 ; — 
d'un polynôme ; 143. 

Idéaux de Kummer 32. 
Identité (en Mathématiques) - 
142; — d'Euler : 156; —s 
remarquables : 142. 

Image (en Mathématiques) - 
109 ; — de l'antécédent : 
20 ; — d'une somme (dans 
C) : 57 ; — d'un produit 
(dans C) : 57 ; — récipro¬ 
que : 20, 21. 

Imaginaires de Galois - 24, 

30. 

c lmrân7 (al-, 'AIT b. Ahmad), ?- 
v. 955, astrologue’ arabe - 
137. 

Inclusion (en Mathématiques) 

- 15 ; — stricte : 15. 

Inégalité de Schwarz - 86 , 

158. 

Infini (en Mathématiques) - 8 ; 

— actuel : 13; — poten¬ 
tiel : 13. 

Infiniment grand 108. 
Infiniment petit 108, 119, 
120. 

Inflexion (en Mathématiques) - 
point d'— : 115, 116, 152. 
Inscrit - angle — ; 146 ; cercle 

— : 146. 

INSTITUTIONES CALCULI 

DIFFERENTIALIS voir Insti¬ 
tutions du calcul différentiel. 
INSTITUTIONES CALCULIIN- 
TEGRALIS - voir Institutions 
du calcul intégral. 
INSTITUTIONS DU CALCUL 
DIFFERENTIEL (Institutio- 
nes calculi differentialis), trai¬ 
té de L. Euler, 1755 - 104. 
INSTITUTIONS DU CALCUL 
INTEGRAL (Institutiones cal¬ 
culi integralis), traité de 
L. Euler, 1768-1770 - 104. 
Intégrale - 119, 120; — au 


sens de Lebesgue : 105 ; — 
au sens de Riemann : 105, 
120 ; calcul des —s défi¬ 
nies : 105, 122, 158; — 
convergente 122, 157, 
158 ; — curviligne : 123 ; — 
de Legendre : 122, 123 ; — 
divergente : 122 ; — dou¬ 
ble : 123, 159; extension 
de la notion d'— définie : 
122; — indéfinie : 122; —s 
abéliennes : 105; —s défi¬ 
nies : 120, 121, 157, 158; 
signification géométrique de 
I'— définie : 122; — sim¬ 
ple : 120; —s multiples : 
159; — triple : 123, 159. 

Intégration - 120, 121 ; — des 
fonctions analytiques : 126; 

— des fractions rationnel¬ 
les : 158; formules d'— : 
158 ; limites d'— : 121 ; limi¬ 
tes infinies d'— : 122; — 
par changement de va¬ 
riable ; 158 ; — par parties : 
158, 159; — par récurren¬ 
ce : 159 ; — sur un interval¬ 
le ouvert ; 122. 

Intégrité (en Mathématiques) - 
anneau d'— : 63, 68 ; domai¬ 
ne d'— : 42, 68. 

Intersection (en Mathémati¬ 
ques) -15. 

Intervalle (en Mathématiques) 

— 79 ; - dans un ensemble : 

18 ; — fermé : 79 ; —s de 
définition d'une fonction nu¬ 
mérique : 155; — semi-ou¬ 
vert : 79. 

INTRODUCTION A L'ANALY¬ 
SE DÇS LIGNES COURBES 
ALGEBRIQUES, œuvre de 
Cramer, 1750 - 76. 

Invariance - 5, 129. 

Invariant - 58, 64 ; — dans une 
transformation : 149; — 
géodésique : 124. 

Inverse — d'un nombre : 31, 
141 ; — d'un opérateur : 50. 

Inversion (en Algèbre et en 

Analyse)-des fonctions 

circulaires : 151 ; — des 
fonctions hyperboliques 
156 ; — des matrices : 62 ; 

— des matrices carrées : 
143. 

Inversion (en Géométrie) -149, 
150. 

INVESTIGATION OF THE 
LAWS OF THOUGHT (An) - 
voir Investigations des lois 
de la pensée. 

INVESTIGATIONS DES LOIS 
DE LA PENSEE (An Inves¬ 
tigation of the Laws of 
Thought). œuvre de George 
Boole, 1854 - 50. 

Involution - 77. 

’lpparhos - voir Hipparque. 

Irrationnels 55. 

Isocèle - 146. 

Isométrie - 85. 

Isomorphisme - 13, 28, 38, 39, 
40, 41, 43, 50. 

Itard (Jean), 1902-1979, mathé¬ 
maticien français : 7. 


J 

Jacobi (Cari Gustav Jacob), 
1804-1851, mathématicien 
allemand - 5, 30, 58, 78, 104, 
105. 

Jacobson (Nathan), 1910- 
mathématicien américain - 
41, 46. 

Janet (Maurice), 1888- 
mathématicien français -106. 

Jean de Séville (Johannes His- 
panensis), floruit 1135-1150, 
traducteur espagnol - 137. 

Jevons (William Stanley), 1835- 
1882, économiste et logicien 
anglais - 13. 

Johannes Hispanensis - voir 
Jean de Séville. 

Jones (Burton Wadsworth), 
1902- , mathématicien 

américain - 32. 

Jordan (Marie Ennemond Ca¬ 
mille, dit Camille), 1838- 
1922, mathématicien fran¬ 
çais : 36, 58, 73, 94, 105, 
129. 

JOURNAL DE CRELLE (Jour¬ 
nal de mathématiques pures 
et appliquées), journal publié 
par le mathématicien A. L. 
Crelle à partir de 1826 - 12, 
37. 


K 

Karmânï (al-), v. 976-1006, ma¬ 
thématicien arabe - 137. 

Kasàni (al-j - voir Kàsi. 

Kâsï (al-, Giyât ad-Dïn Gamèid 
b. Mas c Ud b. Mahmud), 
XV e s., mathématicien et 
astronome persan - 24. 

Kempe (Sir Alfred Bray), 1849- 
1922, mathématicien anglais 
- 128. 

Kepler (Johannes), 1571-1630, 
astronome allemand - 102, 
103. 

Khayyam (Umar ou Omar) - 
voir Umar Hayyâm. 

Khwarezmi (al-) - voir H w 
àrizmi. 

Khwarizmi (al-) - voir H w 
àrizmi. 


Killing (Wilhelm Karl Joseph), 
1847-1923, mathématicien 
allemand - 78. 

Kirby (Robion Cromwell), 1938- 
, mathématicien améri¬ 
cain - 129. 

Klein (Christian Félix), 1849- 
1925, mathématicien alle¬ 
mand - 6, 36, 58, 76, 77, 88, 
94, 105, 129, 148; voir aussi 
Bouteille de —. 

Kloosterman (Hendrik Dou- 
we), 1900- , mathémati¬ 

cien néerlandais - 32. 

Kolmogorov (Andrej Nikolae- 
viô), 1903- , mathémati¬ 

cien soviétique - 6, 132. 

Koszul (Jean-Louis), 1921- 
mathématicien français - 36. 

Kronecker (Léopold), 1823- 
1891, mathématicien alle¬ 
mand - 12, 13, 36, 37, 43, 
47, 58, 72, 73, 105. 

Krull (Wolfgang), 1899-1970, 
mathématicien allemand - 37. 

Kühï (al-, Sahl ad-Dïn), v. 1000, 
mathématicien irano-arabe - 
137. 

Kummer (Ernst Edward), 1810- 
1893, mathématicien alle¬ 
mand - 6, 12, 24, 30, 32, 43, 
94 ; voir aussi Idéaux de —. 

Kushyar ben Labban - voir 
Abù T-Hasan Kùàyâr b. Lab- 
bàn al-Gïlï. 


L 

Lacroix (Sylvestre François), 
1765-1843, mathématicien 
français - 104, 112. 

Lagrange (Joseph Louis, com¬ 
te de), 1736-1813, mathéma¬ 
ticien français d'origine pié- 
montaise - 5, 6, 12, 24, 28, 
33, 36, 58, 73, 76, 77, 94, 
102, 104, 113, 124; voir aus¬ 
si Théorème (en Mathémati¬ 
ques). 

La Hire (Philippe de), 1640- 
1718, astronome et mathé¬ 
maticien français - 77, 94. 

Lamé (Gabriel), 1795-1870, in¬ 
génieur et mathématicien 
français - 27, 78. 

Landau (Edmund), 1877-1938, 
mathématicien allemand - 25, 
32. 

Laplace (Pierre Simon, mar¬ 
quis de), 1749-1827, astrono¬ 
me, mathématicien et physi¬ 
cien français - 6, 12, 58, 104, 
132, 134; voir aussi Loi (en 
Mathématiques). 

Lattis - 50 ; — modulaire : 51. 

Laurent (Pierre Alphonse), 
1813-1854, ingénieur et ma¬ 
thématicien français - 125; 
voir aussi Série (en Mathé¬ 
matiques). 

La Vallée-Poussin (Jean Gusta¬ 
ve Nicolas, dit Charles), 
1866-1962, mathématicien 
belge - 27. 

Lebesgue (Henri-Léon), 1875- 
1941, mathématicien fran¬ 
çais - 6, 14, 105, 119, 132. 

Lefschetz (Solomon), 1884- 
1972, mathématicien améri¬ 
cain d'origine russe - 6, 129. 

Le Gendre (Adrien Marie), 
1752-1833, mathématicien 
français - 6, 24, 27, 30, 104, 
105, 122, 129; voir aussi 
Polynôme. 

Leibniz (Gottfried Wilhelm), 
1646-1716, philosophe, ma¬ 
thématicien et physicien alle¬ 
mand - 1, 3, 5, 6, 11, 13, 14, 
20, 33, 53, 76, 78, 93, 103, 
104, 113, 127. 

Lejeune-Dirichlet (Peter Gus¬ 
tav) - voir Dirichlet. 

Lemme -de D'Alembert : 

12 . 

Lemniscate de Bernoulli -154. 

Léonard de Pise (Leonardo Fi- 
bonacci, dit Leonardo Pisa- 
no, dit), v. 1175-apr. 1240, 
mathématicien italien - 9, 10, 
137. 

Leonardo Pisano - voir Léo¬ 
nard de Pise. 

Leray (Jean), 1906- , ma¬ 

thématicien français - 6, 129. 

Le Roy (Édouard), 1870-1954, 
philosophe et mathémati¬ 
cien français - 106. 

Levi-Civita (Tullio), 1873-1941, 
mathématicien italien - 6, 66, 
124. 

Lévy (Paul Pierre), 1886-1971, 
mathématicien français - 6, 
132. 

L'Hospital (Guillaume François 
Antoine de, marquis de Sain- 
te-Mesme), 1661-1704, ma¬ 
thématicien français - 6, 104. 

Libri (dit Guillaume Timoléon), 
1803-1869, comte Carucci 
délia Sommaïa, mathémati¬ 
cien français - 1. 

Lichnerowicz (André Léon 
Jean Maurice; dit André), 
1915- , mathématicien 

français - 6, 78, 124. 

Lie (Marius Sophus ou Sophüs), 
1842-1899, mathématicien 
norvégien - 6, 36, 78, 124, 
148; voir aussi Théorie (en 
Logique et en Mathémati¬ 
ques). 

Lieu géométrique - 13, 146. 


Ligne de terre - 91. 

Lignes trigonométriques- 

de quelques arcs remarqua¬ 
bles : 150 ; — d'un angle : 
91 ; relations entre les — de 
certains arcs : 150; — d'un 
même arc : 150. 

Limaçon de Pascal - 154. 
Limite (en Mathématiques) — 
— d'une fonction : 108 ; —s 
d'intégration : 121 ; —s infi¬ 
nies d'intégration : 122. 
Lindemann (Cari Louis Ferdi¬ 
nand von), 1852-1939, ma¬ 
thématicien allemand - 24, 
31. 

Linéaire - algèbre — : 58 ; 
combinaison — : 48, 49 ; 
équations différentielles—s : 
159, 160; forme — : 64, 65. 
LINEALE A USDEHNUNGS- 
LEHRE (Algèbre linéaire ex¬ 
térieure), œuvre de Grass- 
mann - 46. 

Liouville (Joseph), 1809-1882, 
mathématicien français - 6, 
24, 31. 

Lipschitz (Rudolf Otto Sigis- 
mund), 1832-1903, mathé¬ 
maticien allemand - 6, 36, 
78, 94, 124. 

Listing (Johann Benedikt), 
1808-1872, mathématicien 
et physicien allemand - 6, 
127, 128, 129. 

Littlewood (John Edensor), 
1885-1977, mathématicien 
anglais - 32. 

LIVRE CLASSIQUE DU CAL¬ 
CUL, œuvre chinoise, VI e et 
I er s. av. J.-C. - 3. 

Lobacevskij (Nikolaj Ivanoviô), 
1792-1856, mathématicien 
russe - 6, 14, 20, 73, 148. 
Lobatchevski (Nikolaï Ivano- 
vitch) - voir Lobaôevskij (Niko¬ 
laj Ivanoviô). 

Logarithme - invention des 
—s : 103; — népérien : 
104, 110, 112, 116. 

Loi (en Mathématiques)- 

binomiale : 134 ; —de Lapla- 
ce-Gauss (= — norma¬ 

le) : 134; — de Poisson : 

134 ; — de probabilité : 133 ; 

— de réciprocité : 30 ; — 
exponentielle : 134; — hy- 
pergéométrique : 134; — 
loglaplacienne : 134 ; — nor¬ 
male (= — de Laplace- 
-Gauss) : 134; — normale 
réduite : 134; — unimoda- 
le, bimodale : 133. 

Loi de composition (en Mathé¬ 
matiques), 36, 37 ; — asso¬ 
ciative : 37 ; — commutati¬ 
ve : 37 ; — distributive par 
rapport à une autre — : 37 ; 
distributivité d'une — exter¬ 
ne : 37 ; — externe : 37 ; 

— interne : 37; propriété 
d'une — ; 37. 

Longitude-d'une sphère : 

96. 

Lorentz (Hendrik Antoon), 
1853-1928, physicien néer¬ 
landais. Prix Nobel de Physi¬ 
que en 1092 - 66, 88. 

Loria (Gino), 1862-1954, mathé¬ 
maticien italien - 1. 

Lousin (Nikolaï Nikolaïevitch) - 
voir Luzin (Nikolaj Nikolaeviô). 
Luca di Borgo voir Pacioli. 
Ludolph Van Ceulen (dit aussi 
Van Keulen ou Van Collen), 
1540-1610, mathématicien 
néerlandais - 89. 

Lusin (Nikolaj Nikolaevic) - voir 
Luzin. 

Luzin (Nikolaj Nikolaeviô), 1883- 
1950, mathématicien soviéti¬ 
que - 105. 


M 

MacLane (Saunders), 1909- 
, mathématicien améri¬ 
cain - 6, 129. 

MacLaurin (Colin), 1698-1746, 
mathématicien écossais - 94, 
103, 104, 155; voir aussi 
Formule (en Mathémati¬ 
ques), Série (en Mathémati¬ 
ques). 

Magnus (Ludwig Immanuel), 
1790-1861, mathématicien 
allemand - 94. 

Mâhànï (al-, Muhammad b. 
c îsâ Abü c Abd Allah), v. 860, 
géomètre et astronome 
arabe - 24, 137; voir aussi 
Equation. 

Mahmüd b. Sebüktigin, sul¬ 
tan ghaznawide - 137. 

Majorant -d'un ensemble 

ordonné — 17, 18. 

Ma'Mün (al-, c Abd Allah), 786- 
833, calife abbasside - 5,137. 

MANUEL DE CALCUL, traité 
de Johann Widmann, 1489 - 
24. 

Markov (Andrej Andreeviô), 
1856-1922, mathématicien 
russe - 6, 132. 

Marrakusi (al-, Ibn al-Bannâ 3 ), 

1256-1321, mathématicien 
arabe - 138. 

Maslama b. Ahmad, ?-v. 1007, 
mathématicien et astrono¬ 
me arabe -137. 

Massey (William S.), 1920- 
, mathématicien améri¬ 
cain - 131, 


Mathématiques - Histoire des 
1 — : voir Histoire des —. 

Matrice (en Mathématiques) - 
58, 59 ; — à éléments com¬ 
plexes : 64 ; anneau des 
—s carrées d'ordre n : 62, 
63 ; — antisymétrique : 60 ; 

— caractéristique : 63 ; — 
carrée : 60, 63, 64 ; — colon¬ 
ne : 60 ; — conjuguée ; 64 ; 
définition de la — ; 60 ; — 
dégénérée (= — singuliè¬ 
re) : 63 ; — de passage : 
99 ; — de permutation : 60 ; 

— des coefficients : 58, 64 ; 
déterminant d'une — car¬ 
rée : 60 ; —diagonale ; 60, 
63 ; — diagonalisable : 63 ; 

— hermitienne : 64 ; inver¬ 
sion de — : 62, 63 ; — li-. 
gne : 60 ; multiplication des 
—s : 61, 62; multiplication 
d'une — par un scalaire : 
61 ; — nulle : 62 ; — numéri¬ 
que : 60 ; rang d'une — : 
60 ; — régulière : 63 ; —s 
égales : 60 ; — singulière 
(= — dégénérée) 63 ; 
—s inverses : 62 ; —s oppo¬ 
sées : 60 ; sous—s d'une 

— : 60 ; — symétrique : 60 ; 
théorie des —s : 59 ; trans¬ 
posé d'une — carrée : 60 ; 
—triangulaire : 60. 

Maximum —d'une fonction : 
115, 116. 

Maxwell (James Clerk), 1831- 
1879, physicien écossais - 
66. 

Médiane (en Géométrie) -146. 
Médiane (en Théorie des pro¬ 
babilités) - 133. 

Médiateur (en Géométrie) - 
plan — : 146. 

Médiatrice (en Géométrie) - 
85, 146. 

Membre (en Mathématiques) - 

— d'une équation : 71. 
Menchov (Dmitri Evahene- 

vitch) - voir Men'àov (Dmitrij 
Evgen'eviô). 

Ménélaos d'Alexandrie (en 

grec : Menelaos ; en latin 
Menelaüs), fin du I er s. ap. 
J.-C., mathématicien grec - 

89. 

Menelaüs (Ménélaos d'Alexan¬ 
drie) - voir Ménélaos 
d'Alexandrie. 

Men’Sov (Dmitrij Evgen'eviô), 
1892- , mathématicien 

soviétique - 105, 125. 

Méray (Hugues Charles Robert, 
dit Charles), 1835-1911, ma¬ 
thématicien français -13, 53, 
125. 

Mercator (Nicolaus Kaufmann, 
dit), 1620-1687, mathémati¬ 
cien allemand - 103. 

Méridien (en Géométrie analy¬ 
tique) — origine : 96. 
Mersenne (abbé Marin), 1588- 
1648, mathématicien et théo¬ 
ricien de la musique français 

— voir Fonction (en Mathéma¬ 
tiques). 

Mesure-des angles : 89 ; 

— du cercle : 4 ; — d'un arc 
(ou d'un angle) modulo 2 n : 

90. 

Métamathématique - 14. 
Métathéorie - 14. 

Méthode (en Mathématiques) 

-analytique : 75, 76 ; — 

de descente infinie : 24, 27 ; 

— de Ferrari : 72, 144; — 
de la variation des constan¬ 
tes : 105 ; — des approxima¬ 
tions successives : 105; 

— des « fonctions majoran¬ 
tes » : 105 ; — de Tartaglia- 
Cardan : 144; — hypothéti- 
co-déductive : 75 ; — infini¬ 
tésimale : 76 ; — par exhaus- 
tion : 102 ; — projective : 

76. 

METHOD OF FLUXIONS AND 
INFINITE SERIES (Méthode 
des fluxions et des séries 
infinies), traité de Newton, 
écrit en latin en 1671, publié 
en anglais en 1736 - 104. 
Meusnier de la Place (Jean- 
Baptiste), 1754-1793, mathé¬ 
maticien français — 124. 
Miller (Jeffrey Charles Percy), 
1906- , mathématicien 

américain - 25. 

Milnor (John Willard), 1931- 
, mathématicien améri¬ 
cain - 6, 129. 

Minimum - — d'une fonction : 
115, 116. 

Minkowski (Hermann), 1864- 
1909, mathématicien litua¬ 
nien - 32. 

Minorant — d'un ensemble ; 
18. 

Minute (en Trigonométrie) - 89. 
MIRIFICI LOGARITHMORUM 
CANONIS DESCRIPTIO 

(Description de la règle mer¬ 
veilleuse des logarithmes), 
œuvre de John Napier (= 
Neper), 1614-103. 

Môbius (August Ferdinand), 

1790-1868, astronome et ma¬ 
thématicien allemand - 6, 12, 

77, 127, 128, 129; voir aussi 
Ruban de —. 

Modularité - 51. 

Module (en Mathématiques) - 
46 ; — à droite sur un an¬ 
neau : 46 ; — à gauche sur 


un anneau ; 46; — d'un 
nombre complexe : 56, 57, 
126. 

Moïse (Edwin Evariste), 1918- 
, mathématicien améri¬ 
cain - 129. 

Moivre (Abraham de), 1667- 
1754, mathématicien anglais 

— 5, 6, 12, 33, 53, 104, 132; 
voir aussi Formule (en Ma¬ 
thématiques). 

Molien (Théodore), 1861-1941, 
mathématicien russe - 37. 
Moment (en Théorie des pro¬ 
babilités) — algébrique, ab¬ 
solu : 133. 

Monade 39. 

Monge (Gaspard, comte de Pé- 
luse), 1746-1818, mathémati¬ 
cien français - 5, 6, 76, 77, 
78, 91, 94, 104, 124. 
Monoïde - — commutatif : 
39 ; congruence dans un — : 
42 ; — des substitutions : 
39 ; — fini : 40 ; — non 
commutatif : 39 ; ordre d'un 

— : 40 ; sous-groupe d'un 

— : 40. 

Monôme - 66, 67, 141. 
Monomorphisme - 50. 

Montel (Paul Antoine), 1876- 
1975, mathématicien fran¬ 
çais - 105, 125. 

Montmort (Pierre Rémond de), 
1678-1719, mathématicien 
français - 6, 132. 

Montucla (Jean-Étienne), 
1725-1799, historien des ma¬ 
thématiques français - 1. 
Morgan (Augustus De) - voir 
De Morgan. 

Morphisme - définition d'un 

— : 38 ; — d'espace vecto¬ 
riel (= opérateur linéaire) - 
50 ; différentes sortes de 
—s ; 38. 

Moyenne (en Mathématiques), 
133; — proportionnelle : 
140; théorème de la — : 
115. 

Moyens —d'une proportion : 
140. 

Müller (Johann) - voir Regio- 
montanus. 

Multiple - 25. 

Multiplication (en Mathémati¬ 
ques) -dans N ; 25 ; — 

dans Z : 28 ; — des clas¬ 
ses : 44 ; — des fractions : 
140 ; — des fractions ration¬ 
nelles : 70 ; — des monô¬ 
mes : 141 ; — des nombres 
relatifs : 141 ; — d'un poly¬ 
nôme par un réel : 67 ; — 
d'un vecteur par un scalai¬ 
re : 86. 

Mu'tamin (al-, Yüsuf) - voir 
Yùsuf al-Mu’tamin. 

Muzaffar b. Muzaffar at-Tüsï 

(al-, al-Tousi ou et-Tousi chez 
les Occidentaux), ? v. 1213, 
astronome et mathémati¬ 
cien arabe - 138. 

Mydorge (Claude), 1585-1647, 
mathématicien français - 77. 


N 

Napier (John Neper, dit aussi), 
1550-1617, mathématicien 
écossais - 38, 103, 112. 

Nasir ad-Dïn at-Tüsï (al-Tusi 
chez les Occidentaux), 1201- 
1274, astronome et mathé¬ 
maticien persan - 24, 89,138. 

Neper (John), voir Napier. 

Neugebauer (Otto), 1899- 
historien des sciences et as¬ 
syriologue américain - 2. 

Neumann (Cari Gottfried), 
1832-1925, mathématicien 
allemand - 105. 

Neumann (John von), 1903- 
1957, mathématicien améri¬ 
cain - 14, 47. 

Nevanlinna (Rolf Herman), 
1895- , mathématicien 

et physicien finlandais - 105. 

Newton (Sir Isaac), 1642-1727, 
mathématicien et physicien 
anglais - 3, 5, 6, 11, 12, 33, 
52, 75, 76, 78, 93, 94, 102, 
103, 104, 105, 113, 119; 
voir aussi Binôme de —. 

Nicomaque de Gérase (Niko- 
mahos), fin du I er s., mathé¬ 
maticien grec - 137. 

Nikodÿm (Otton Martin), 1887- 
1974, mathématicien améri¬ 
cain d'origine polonaise - 6. 

Nikomahos - voir Nicomaque 
de Gérase. 

Noether (Amalie Emmy), 1882- 
1935, mathématicienne alle¬ 
mande - 12, 37, 46. 

Noether (Max), 1844-1921, ma¬ 
thématicien allemand - 6, 46, 
78. 

Nombre -de Betti ; 131 ; 

— e : 31, 112. 

Nombre (en Mathématiques), 

— algébrique : 31 ; axiomes 
des —s réels : 54 ; — cardi¬ 
nal transfini : 25 ; — com¬ 
plexe : 12, 31, 32, 53 ; corps 
C des —s complexes : 55 ; 
corps IR des —s réels : 53 ; 
élévation d'un — complexe à 
la puissance n : 142 ; ensem¬ 
ble Q des —s rationnels ; 
31 ; — entier : 24 ; forme 
exponentielle d'un — com¬ 
plexe : 143; forme trigono- 


métrique d'un — complexe : 
57 ; généralisation de la no¬ 
tion de — : 12, 30 ; générali¬ 
sation de la notion de — 
entier : 27 ; — hypercom¬ 
plexe : 32 ; — imaginaire ; 
5, 11 ; — irrationnel : 4, 8, 
24, 31, 53, 54; — négatif : 
5, 11 ; notion de — com¬ 
plexe : 53 ; — positif : 11 ; 

— premier : 7, 24, 25, 27 ; 

— premier complexe : 32 ; 
premier — transfini cardinal : 
19 ; produit de deux —s com¬ 
plexes : 142; quotient de 
deux —s complexes : 142; 
racines n-ièmes d'un — com¬ 
plexe : 143; raréfaction des 
—s premiers : 27 ; — ration¬ 
nel : 10; — réel : 31, 32, 
52 ; répartition des —s pre¬ 
miers : 27 ; représentation 
d'un — par une forme qua- 
dratatique : 32 ; —s amia¬ 
bles : 137 ; science des —s 
chez les Grecs : 7 ; —s com¬ 
plexes conjugués : 56, 142 ; 
—s hypercomplexes : 60 ; 
—s idéaux : 24 ; —s pre¬ 
miers entre eux : 25; —s 
proportionnels ; 140 ; —s re¬ 
latifs : 140; théorie des 
—s : 24 ; — transcendant : 
19, 24, 31, 54, 55; — trans¬ 
fini ordinal : 19, 20. 

Non-résidus - — quadrati¬ 
ques : 30. 

Normale (en Mathématiques) - 

— à une courbe : 152 ; —s 
aux coniques : 154. 

Norme (en Mathématiques) - 
106; — d'un nombre com¬ 
plexe : 32. 

Numérateur - 31, 140. 

Numération (en Mathémati¬ 
ques) - 138; — attique : 
137; — binaire : 138; — 

dans un système de base 

B : 138; — décimale : 4, 
138; — grecque : 137; — 

grecque savante : 137; — 

romaine : 138; — sexagési¬ 
male (— babylonnienne) : 2, 
4 ; système de — d'Archimè¬ 
de ; 137. 

o 

a) (oméga (en Théorie des en¬ 
sembles)) - 20. 

Oblique 85, 146. 

Octogone - 146. 

Ombre (en Mathématiques) - 

— d'une surface : 92. 

Opérateur (en Mathémati¬ 
ques) -de translation ; 

57 ; domaine d'— (d'une loi 
de composition externe) ; 
37 ; domaine d'—s : 48 ; — 
d'une similitude : 57 ; — li¬ 
néaire (= morphisme d'espa¬ 
ce vectoriel) : 50; — nul ; 
50 ; — unité : 50. 

Opérations (en Mathémati¬ 
ques) -dans l'ensemble 

des polynômes non nuis : 
67 ; — dans N : 25 ; — en 
système binaire : 139; — 
sur les ensembles ; 15; — 
sur les monômes : 141 ; — 
sur les nombres entiers ; 
139; — sur les nombres 
relatifs : 140. 

Opposés par le sommet - an¬ 
gles — : 146. 

Ordonnée - axe des —s : 95. 

Ordre (en Mathématiques) — 
d'un déterminant : 58; — 
partiel : 17; relation d'— : 
17, 54 ; — total : 17. 

ORESME (Nicole d'), v. 1325- 
1382, théologien français - 
7 5. 

Orthocéntre - 146. 

Orthogonal - droites —es : 
146 ; projection —e : 85, 91. 

Osculation - point d'— : 156. 

Oughtred (William), 1575- 
1660, mathématicien anglais 

— 103. 

Ouvert (en Topologie) - 128, 
129. 


p 

Pacioli (Luca, dit aussi Paciolo 
ou Paciuolo ou Luca di Bor¬ 
go). 1445-v. 1510, mathéma¬ 
ticien italien - 10. 

Painlevé (Paul Prudent), 1863- 
1933, homme politique et 
mathématicien français - 6. 

Pall (Gordon), mathématicien 
américain contemporain - 32. 

Pappos - voir Pappus. 

Pappus (en grec : Pappos), 
IV e s., mathématicien d'A¬ 
lexandrie - 4 ; voir aussi Pro¬ 
blème, Théorème (en Mathé¬ 
matiques). 

Papyrus — de Rhind : 3. 

Parabole (en Mathématiques) - 
112, 150, 154. 

Paraboloïde — hyperboli¬ 
que : 88, 154. 

Paradoxe — de Galilée : 13, 
19 ; — de J. Richard : 13. 

Parallélépipède - 146; — fer¬ 
mé, ouvert : 118. 

Parallèles - 146 ; — dans l'es¬ 
pace : 146. 

Parallélogramme - 147; — 
aplati ; 83. 
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Parent (Antoine), 1660-1726, 
mathématicien français - 94. 

Parenthèses (en Mathémati¬ 
ques) -et calcul algébri¬ 

que élémentaire : 141 ; su- 
pression des — : 141. 

Partie (en Mathématiques) - 
ensemble des —s (= boo¬ 
léen) : 15; — imaginaire 
(d'un nombre complexe) : 
56 ; — réelle (d'un nombre 
complexe) : 56. 

Partie stable — d'un ensem¬ 
ble : 38. 

Partition (en Mathématiques) - 

— d'un ensemble : 15; — 
d'un ensemble fini : 36. 

Pascal (Biaise). 1623-1662, 
écrivain, mathématicien et 
physicien français - 6, 11, 24, 
33. 77. 93. 103, 104, 113, 
132; voir aussi Limaçon. 
Triangle. 

Pasch (Moritz), 1843-1930, ma¬ 
thématicien allemand - voir 
Axiome, Théorème (en Ma¬ 
thématiques). 

Passage (en Mathématiques) - 
matrice de — : 99. 

Passage à la limite 47. 

1 Pavé (en Mathématiques)- 

fermé, ouvert : 118, 130. 

Peano (Giuseppe), 1858-1932, 
logicien et mathématicien ita¬ 
lien - 6. 13, 46, 47, 52, 53, 
105 ; voir aussi Axiome. 

Pearson (Karl), 1857-1936, ma¬ 
thématicien anglais - 6, 132. 

Peirce (Benjamin), 1809-1880, 
astronome et mathémati¬ 
cien américain - 37, 58. 

Peirce (Charles Sanders), 1839- 
1914, logicien, philosophe et 
savant américain -13, 37. 58. 

Pentagone (en Mathémati¬ 
ques) - 147. 

Pente-d'une droite : 112, 

147; voir aussi Coefficient 
angulaire. 

Périmètre - 147. 

Périodicité (en Mathémati¬ 
ques) - — d'une, fonction 
circulaire : 90; — d'une 
fonction numérique : 155. 

Permutation -34; — avec 
répétitions : 34 ; matrice de 

— : 60. 

Perpendiculaire - 85, 147 ; — 

commune à deux droites 
dans l'espace : 147 ; droites 
—s : 85, 147 ; plans —s : 
147. 

Personier de Roberval (Gilles) 

- voir Roberval. 

Personne de Roberval (Gilles) 

- voir Roberval. 

PGCD (sigle pour Plus Grand 
Commun Diviseur) - 139, 
140; — de n polynômes : 
143. 

PHILOSOPHIAE NATURAUS 
PRINCIPIA MATHEMATICA 

- voir Principes mathémati¬ 
ques de la philosophie natu¬ 
relle. 

Picard (Charles Émile). 1856- 
1941, mathématicien fran¬ 
çais - 6. 105, 106, 123, 125; 
voir aussi Théorème (en Ma¬ 
thématiques). 

Pisot (Charles), 1910- , ma¬ 

thématicien français - 25. 

Plan (en Géométrie) - — à 
l'infini : 76, 87, 152 ; — os- 
culateur : 124; structure du 

- : 83. 

Plan (en Mathématiques) - 
147; — d'Araant-Cauchy - 
125; épure d un — : 92 ; 
équation du — : 151, 152. 

Platon - voir Platon. 

Platon (Platon), 428-348/7 av. 
J.-C., philosophe grec - 4. 

Plücker (Julius), 1801-1868, 
mathématicien et physicien 
allemand - 6, 77, 94. 

Plus Grand Commun Divi¬ 
seur (= PGCD) - 139, 140. 

Plus Petit Commun Multiple 
(= PPCM) - 139, 140. 

Poincaré (Jules Henri), 1854- 
1912, mathématicien fran¬ 
çais - 5, 6, 14. 78, 105, 124, 
125, 129, 130, 131, 132. 

Point (en Mathématiques)- 

à l'infini : 87, 152 ; —d'accu¬ 
mulation : 107, 128, 130, 
131 ; — de rebroussement : 
156; — d'inflexion : 115, 
152; — d'osculation : 156; 

- double d'une transforma¬ 
tion : 149; épure d'un — : 
92 ; — fixe : 129 ; — isolé : 
131 ; —s conjugués par rap¬ 
port à un cercle : 148; — 
singulier : 125, 156; —s re¬ 
marquables d'une fonction 
y = f (x) : 115. 

Poisson (Siméon-Denis), 1781- 
1840, mathématicien et phy¬ 
sicien français - 6, 132 ; voir 
aussi Formule (en Mathéma¬ 
tiques), Loi (en Mathémati¬ 
ques). 

Polaire (en Géométrie) - 148, 
149. 

Pôle (en Géométrie) - 148. 

Polyèdre (en Géométrie) -147. 

Polyèdre (en Topologie (= 
complexe)) - 130, 131. 

Polygonal - ligne —e : 147. 

Polygone - 147. 

Polynôme - 66 ; addition et 
soustraction des —s : 142 ; 


— algébrique : 142; — à 
une indéterminée : 66, 67, 
68 ; — caractéristique : 63 ; 

— dans le corps des réels : 

66 ; degré d'un — : 66. 
142; degré d'un — non 
nul : 67 ; division euclidien¬ 
ne des —s : 68 ; factorisa¬ 
tion d'un — : 69, 142; — 
formel : 67 ; — homogè¬ 
ne : 142 ; idéal d'un — for¬ 
mel ; 143; multiplication 
des —s : 142; multiplica¬ 
tion d'un — par un réel : 

67 ; — neutre pour l'addi¬ 
tion : 67 ; opération dans 
l'ensemble des —s non 
nuis : 67, 68 ; — ordonné : 
142; racines d'un — : 68 ; 
réduction des termes d'un 

— 142; —s de Legendre : 
104 ; —s identiques : 67 ; 
zéros d'un — : 68. 

Pompeiu (Dimitrie), 1873-1954, 
mathématicien roumain - 
125. 

Poncelet (Jean-Victor), 1788- 
1867, général et mathémati¬ 
cien français - 6, 76, 88, 

127 ; voir aussi Théorème 
(en Mathématiques). 

Pontrjagin (Lev Semenoviô), 
1908- . mathématicien 

soviétique - 6. 
Postmultiplication - 62. 
Postulat - 148; « — d'Eucli- 
de » : 75, 79, 148. 

PPCM (sigle pour Plus Petit 
Commun Multiple) - 139, 
140; — de n polynômes : 
143. 

Prémultiplication - 62. 

Preuve (en Mathématiques) - 

— des opérations : 139 ; — 
par 9 : 29, 30. 

Primitive (en Mathématiques) 
-121,122. 

Principe (en Mathématiques) - 

— de dualité : 51. 77. 87, 
88 ; — des intervalles fer¬ 
més emboîtés (= axiome de 
Cantor) : 54, 55. 

PRINCIPES MATHÉMATI¬ 
QUES DE LA PHILOSOPHIE 
NATURELLE (Philosophiae 
natu.ralis principia mathemati- 
ca), œuvre principale de 
Newton, 1687 - 104. 
Prismatique - surface — : 147. 
Prisme - 147. 

Probabilité - voir Densité de 
—; — complémentaire : 
132; — composée (théorè¬ 
me) : 133 ; — d'apparition 
d'un événement : 133; — 
d'un événement : 132; — 
élémentaire : 133; loi de 

— : 133 ; — totale (théorè¬ 
me) : 133. 

Problème-de Goldbach : 

32 ; — de la décision : 14 ; 
« — de Pappus » : 93 ; — 
des nœuds : 128; — des 
ponts de Kônigsberg : 128; 

— de Waring : 25, 32 ; — 
du coloriage des cartes : 

128 ; — du tisserand : 29. 
Proclus (Proklos, dit aussi Pro¬ 
clos de Constantinople), 412- 
485, philosophe grec -1,4, 
75. 

Produit (en Mathématiques) - 

— cartésien : 15, 22; com¬ 
posantes du — vectoriel : 
97 ; — dans le corps C : 
55 ; — de deux éléments 
d'un ensemble : 38 ; — de 
deux nombres complexes : 
142 ; — de deux polynô¬ 
mes : 67 ; — de deux rota¬ 
tions : 40 ; — de deux subs¬ 
titutions : 35; — de deux 
transformations : 149; — 

de plusieurs ensembles : 
23 ; — des opérateurs : 50 ; 

— des sous-ensembles d'un 
groupe : 41 ; propriétés du 

— scalaire : 86 ; — scalai¬ 
re : 47, 86 ; — scalaire de 
deux vecteurs : 96 ; — sca¬ 
laire d'une matrice : 61 ; —s 
en croix : 58 ; — vectoriel : 
87, 97. 

Projection (en Mathématiques) 

— — orthogonale : 85, 91, 
147 ; rapport de — : 86. 

Proklos (philosophe néoplatoni¬ 
cien) - voir Proclus. 
Proportion - 140 ; extrêmes et 
moyens d'une — : 140; 
théorie des —s : 24. 
Proportionnelle - quatrième 

— : voir Quatrième. 
Ptolemaios - voir Ptolémée. 
Ptolémée (Ptolemaios, Clau¬ 
de), v. 90-v. 168, astronome, 
mathématicien et géographe 
grec - 4, 89, 138 ; voir aussi 
Relation (en Mathémati¬ 
ques). 

Puiseux (Victor Alexandre), 
1820-1883, astronome et ma¬ 
thématicien français - 125. 
Puissance (en Mathématiques) 

— calcul sur les —s : 141 ; — 
du continu : 19; — d'un 
ensemble : 18; — d'un 
point par rapport à un cercle, 
à une sphère : 147 ; — n- 
ième d'un nombre com¬ 
plexe : 142 ; — n-ième d'un 
nombre relatif : 141. 

Puthagoras - voir Pythagore. 
Pyramide (en Géométrie) -147. 


Pythagore (Puthagoras), VI e s. 
av. J.-C., philosophe grec - 4, 
7, 8, 75 ; voir aussi Relation 
(en Mathématiques), Théorè¬ 
me (en Mathématiques). 

Pythagoriciens - 7, 8, 24, 75. 


Q 

Qalasa Dï (al-). ?-1486, mathé¬ 
maticien et juriste arabe - 
138. 

Quadratique - forme — : 24, 
32, 64. 

Quadrature-de la cycloï- 

de? 103. 

Quadrilatère - 147 ; — aplati : 
83. 

Quadriques (= surfaces du se¬ 
cond ordre) - 88, 154, 155. 

Quantificateur - 17; — exis¬ 
tentiel (« 3 ») : 17 ; — uni¬ 
versel (« V ») : 17. 

Quaternion - 37, 43, 44. 

Quatrième proportionnelle - 

140. 

Qunfüd (al-, Ibn), ?-1407 ou 
1408, mathématicien arabe - 
138 

Quotient - 25, 26, 141 ; — de 
deux nombres complexes : 
142 ; ensemble — : 17 ; es¬ 
pace vectoriel — : 49, 50. 


R 

Rabattement - 91. 

Racine (en Calcul numérique) - 

— carrée : 139; — cubi¬ 
que : 141 ; — n lème d'un 
nombre : 141 ; —s n l5f1ies 
d'un nombre complexe : 
143. 

Racine (en Mathématiques) - 

— d'ordre : 12 ; — double : 

12 ; relations entre les coeffi¬ 
cients et les —s d'une équa¬ 
tion : 72 ; —s d'une équa¬ 
tion : 70, 71 ; —s d'un poly¬ 
nôme : 68. 

Rademacher (Hans Adolph), 
1892-1969, mathématicien 
américain - 125. 

Radian - 89. 

Radon (Johann Karl), 1887- 
1956, mathématicien autri¬ 
chien - 6. 

Raisonnement-par récur¬ 

rence : 25. 

Ràmânujan (Srinivasa), 1877- 
1920, mathématicien indien 
-32. 

Rapport (en Mathématiques) - 

— anharmonique (= birap- 
port) : 88 ; — de deux nom¬ 
bres réels : 140 ; — de pro¬ 
jection : 86. 

Raréfaction-des nombres 

premiers : 27. 

Rationnels - 55 ; ensemble Q 
des — : 31. 

Rayon (en Mathématiques) - 

— d'un cercle : 145; — 
d'une sphère : 96, 147; — 
vecteur : 95. 

RECHERCHES ARITHMETI¬ 
QUES - voir Disquisitiones 
arithmeticae. 

Réciprocité - loi de — : 30. 

Rectangle - 147. 

Rectification-d'un arc de 

courbe : 103. 

Récurrence raisonnement 
par — : 25. 

Réduction (en Mathématiques) 

— — au même dénomina¬ 
teur : 45, 140. 

Réels-algébriques : 55 ; 

axiomes des nombres — : 
54 ; — considérés comme la 
limite d'une série convergen¬ 
te : 52 ; définition des — : 
53, 54 ; ensemble IR des 

— : 31. 

Réflexivité - 16. 

Regiomontanus (Johann Mül- 
ler, dit en latin), 1436-1476, 
astronome et mathémati¬ 
cien allemand - 89, 138. 

Règle (en Mathématiques) — 
de Cauchy : 119, 157; — 
de d'Alembert : 157 ; — de 
Duhamel : 157 ; —s de cal¬ 
cul sur les ensembles ; 16; 
—s de convergence : 52. 

Relation (en Mathématiques) - 
16; — de Chasles : 81, 90, 
97 ; — de Chasles générali¬ 
sée : 82 ; — de Chasles 
pour les vecteurs : 86 ; — 
de Pythagore : 99 ; —d'équi¬ 
potence : 18, 19; —d'équi¬ 
valence : 17, 18, 19 ; — d'or-. 
dre : 17, 54 ; — d’ordre dans 
N : 25 ; propriétés des —s : 
16 ; —s de Ptolémée : 147 ; 
—s entre les lignes trigono- 
métriques de certains arcs : 

150 ; —s entre les lignes 
trigonométriques d'un mê¬ 
me arc : 150. 

Rentrant - angle — : 147. 

Répartition (en Mathémati¬ 
ques) - fonction de — : 133. 

Repère (en Mathématiques) - 

— cartésien dans le plan : 
95 ; — cartésien dans l'espa¬ 
ce : 95 ; changement de — : 
98, 99 ; — euclidien : voir 
Rotation ; — euclidien (= — 
orthonormé) : 95, 122 ; — 


orthonormé (= — eucli¬ 
dien) : 95. 

Représentation (en Mathéma¬ 
tiques) -graphique : 22 ; 

— graphique (des nombres 
complexes) : 56. 

Réseau (en Topologie) - 128. 

Résidus quadratiques - 30. 

Résolution (en Mathémati¬ 
ques) — des triangles quel¬ 
conques : 151 ; — des trian¬ 
gles rectangles : 151 ; — 
d'une équation : 71. 

Réunion (= somme logique) - 
15. 

Rey (Abel), 1873-1940, philoso¬ 
phe français - 1. 

Rhind (Alexander Henry), 1833- 
1863 antiquaire écossais - 
3 ; voir aussi Papyrus. 

Riccati (Jacopo Francesco), 
1676-1754, mathématicien 
italien - 94, 104. 

Ricci-Curbastro (Gregorio), 
1853-1925, mathématicien 
italien - 66. 

Richard (Jules-Antoine), 1862- 
1956, mathématicien fran¬ 
çais - voir Paradoxe. 

Riemann (Georg Friedrich 
Bernhard), 1826-1866, ma¬ 
thématicien allemand - 5, 6, 
12, 14. 27, 30, 37, 58, 66, 
73, 78, 94, 105, 119, 120, 
122, 124, 125, 129, 131, 148, 
158 ; voir aussi Condition (en 
Mathématiques), Intégrale. 
Surface (en Mathématiques). 

Ritt (Joseph Fels), 1893-1951, 
mathématicien américain - 
106. 

Robert de Chester (Robertus 
Castrensis = Robert de Réti¬ 
nes), floruit 1141-1150, tra¬ 
ducteur britannique et exégè¬ 
te coranique - 137. 

Robert de Rétines - voir Ro¬ 
bert de Chester. 

Robertus Castrensis - voir Ro¬ 
bert de Chester. 

Roberval (Gilles Personne ou 
Personier de), 1602-1675, 
mathématicien et physicien 
français - 93, 103, 113. 

Rolle (Michel), 1652-1719, ma¬ 
thématicien français - 6, 72, 
73, 104, 115; voir aussi 
Théorème (en Mathémati¬ 
ques). 

Romanov (Nikolaj Pavloviô), 
1907- , mathématicien 

soviétique - 32. 

Rosati (Carlo), 1876-1929, ma¬ 
thématicien italien - 6. 

Rotation-dans le plan : 

149; — d'un repère eucli¬ 
dien : 99. 

Roth (Friedrich Klaus), 1925- 
, mathématicien anglais 

- 25. 

Roulette (= cycloïde) - 103. 

Ruban de Môbius - 129. 

Rudolff (Christoph), 1500?- 
1545?, mathématicien alle¬ 
mand - 10. 

Ruffini (Paolo), 1765-1822, ma¬ 
thématicien et médecin ita¬ 
lien - 73. 

Russell (Bertrand Arthur Wil¬ 
liam Russell, 3 e comte), 
1872-1970, logicien et philo¬ 
sophe anglais - 6, 13, 14. 


S 

Saccheri (Giovanni Girolamo), 
1667-1733, logicien italien - 
5, 6, 148. 

Safa (as-, Ihwân, « Frères de 
la Pureté »), secte scienti- 
fico-religieuse arabe - 137. 

Saint-Venant (Adhémar Jean- 
Claude Barré, comte de), 
1797-1886, ingénieur et ma¬ 
thématicien français - 78, 
124. 

Saladini (Girolamo), 1731- 
1813, mathématicien italien 
-94. 

Salem (Raphaël), 1898-1963, 
mathématicien français - 25. 

Salmon (George), 1819-1904, 
mathématicien et théologien 
irlandais - 94. 

Sarton (George Alfred Léon), 
1884-1956, historien des 
sciences américain d'origine 
belge -1. 

Saurin (Joseph), 1655-1737, 
mathématicien français -104. 

Savile (Sir Henry), 1549-1622, 
mathématicien anglais - 148. 

Scalaire - multiplication d'un 
vecteur par un — : 86 ; pro¬ 
duit — : 47, 86 ; produit — 
de deux vecteurs : 96 ; pro¬ 
duit — d'une matrice : 61, 
62 ; propriétés du produit 
— : 86. 

Schauder (Pavel Julius), 1899- 
1940, mathématicien polo¬ 
nais - 106. 

Scheffers (Georg Wilhelm), 
1866-1945, mathématicien 
allemand - 37. 

Schmidt (Erhard), 1876-1959, 
mathématicien allemand - 47. 

Schouten (Jan Arnoldus), 1883- 
, mathématicien néerlan¬ 
dais - 66. 

Schur (Friedrich Heinrich), 
1856-1932, mathématicien 
allemand - 37. 


Schwarz (Karl Hermann Aman- 
dus), 1843-1921, mathémati¬ 
cien allemand - 105, 124; 
voir aussi Inégalité de —, 
Théorème (en Mathémati¬ 
ques). 

Scipione dal Ferro, v. 1465- 
1526, mathématicien italien 

— 11, 72. 

Sécante (en Géométrie) - 147. 

Sécante (en Trigonométrie) - 
90. 

Segment (en Géométrie) -147. 

Segre (Beniamino), 1903-1977, 
mathématicien italien - 124. 

Segre (Corrado), 1863-1924, 
mathématicien italien - 78. 

Seifert (Karl), 1907- , ma¬ 

thématicien allemand - 6. 

Selberg (Atle). 1917- . ma¬ 

thématicien norvégien - 6, 
25. 

Semi-groupe - 39. 

Série (en Mathématiques) - 
118, 119; —arithmétique : 

119 ; — à termes réels de 
signes quelconques : 157; 
convergence d'une — ' 119, 
157; — de comparaison : 
157 ; — de Laurent : 125 ; 

— de Taylor : 125, 157 ; — 
dite de MacLaurin : 104 ; — 
géométrique : 119; — hy- 
pergéométrique : 52 ; — illi¬ 
mitée ; 157 ; — oscillante : 
157; —s de Fourier : 105, 
157 ; —s entières : 157. 

Serre (Jean-Pierre), 1926- 
mathématicien français - 36. 

Serret (Alfred), 1819-1885, ma¬ 
thématicien français - 73. 

Siegel (Cari Ludwig), 1896- 
, mathématicien alle¬ 
mand - 6, 25, 32. 

Sifr (mot arabe à l'oriaine du 
mot français : chiffre) - 5. 

Signes numériques-in¬ 

diens : 4. 

Similitude - 147; — plane : 
149. 

Simon de Bruges - voir Stevin 
(Simon). 

Simplexe - 130, 131. 

Simplification-des frac¬ 

tions : 140. 

Simson (Robert), 1687-1768, 
mathématicien écossais - 
voir Droite. 

Sinin b. Tâbit, ?-943, astrono¬ 
me, mathématicien et physi¬ 
cien arabe - 137. 

Sinus (en Mathématiques) - 
90 ; — hyperbolique : 118. 

Sinusoïde - 117. 

Skolem (Thoralf Albert), 1887- 
1963, mathématicien et logi¬ 
cien norvégien - 6, 14. 

Smith (Henry John Stephen), 
1826-1883, mathématicien ir¬ 
landais - 47. 

Snirel'Man (Lev Genrihoviô), 
1905-1938, mathématicien 
soviétique - 32. 

Solide - 86. 

Solution (en Mathématiques) - 

— d'une équation : 70, 71. 

Somme (en Mathématiques) - 

— de carrés : 27 ; — de 
deux éléments d'un ensem¬ 
ble : 37, 38 ; — directe de 
sous-espaces : 49 ; — logi¬ 
que (= réunion) : 15. 

Sous-corps - 45. 

Sous-ensemble - 15. 

Sous-espace vectoriel - 49. 

Sous-groupe-cyclique : 

40, 41 ; — d'un monoïde : 
40 ; — invariant (= — distin¬ 
gué) : 41 ; — unité : 40. 

Sous-matrice — d'une matri¬ 
ce : 60. 

Sous-monoïde - 39. 

Soustraction-dans N : 

25 ; — des fractions : 140 ; 

— des nombres relatifs : 
141. 

Sphère -147. 

Spirale - — logarithmique : 
154. 

Staudt (Karl Georg Christian 
von), 1798-1867, mathémati-, 
cien allemand - 6, 77, 129. 

Steiner (Jakob), 1796-1869, 
mathématicien suisse - 6, 
58, 76, 77, 88, 94. 

Steinitz (Ernst), 1871-1928, 
mathématicien allemand -12, 
37. 73. 

Stéradian - 89, 90. 

STETIGKEIT UND IRRATIO- 
NALE ZAHLEN (Continuité 
et nombres irrationnels), œu¬ 
vre de Dedekind, 1872 - 53. 

Stevin (Simon, dit aussi Simon 
de Bruges), 1548-1620, ma¬ 
thématicien et physicien fla¬ 
mand - 5, 10, 11. 

Stieltjes (Thomas Jan), 1856- 
1894, mathématicien fran¬ 
çais - 105, 119. 

Stifel (Michael), v. 1487-1567, 
mathématicien allemand -10, 
33. 

Stirling (James), 1692-1770, 
mathématicien anglais - 94, 
104; voir aussi Formule (en 
Ma thématiques). 

Stokes (Sir George Gabriel), 
1819-1903, mathématicien 
et physicien irlandais - 66. 

Stone (Marshal Harvey), 1903- 
, mathématicien améri¬ 
cain - 47. 

Strophoïde - 154. 


Structure (en Algèbre) - — 
algébrique : 39, 41,46 ; axio¬ 
mes de la — de lattis : 51 ; 

— d'anneau : 41 ; — de 
corps : 43, 44 ; — de grou¬ 
pe : 39, 40 ; — de lattis : 
51 ; — de sous-groupe : 40 ; 

— d'espace vectoriel : 46, 
58. 

Structure (en Mathématiques) 

— 13 ; — sous-jacente : 38 ; 

— topologique : 127, 128. 
Study (Eduard), 1862-1930, 

mathématicien allemand - 37, 
58. 

Sturm (Jacques Charles Fran¬ 
çois, dit Charles), 1803-1855, 
mathématicien français - 6, 
73, 94; voir aussi Fonction 
(en Mathématiques), Théorè¬ 
me (en Mathématiques). 
Substitution (en Mathémati¬ 
ques) - 35 ; — de degré n : 
35 ; ensemble des —s : 39, 
40 ; — identique (= — neu¬ 
tre) : 35 ; matrice de — : 
64 ; — neutre (= — identi¬ 
que) : 35 ; parité d'une 

— : 35 ; produit de deux 
—s : 35. 

Suite (en Mathématiques) - 
118, 119; — convergente : 
103, 106; *— de Cauchy : 
53, 107. 

Supplément (en Mathémati¬ 
ques) - 147. 

Surface (en Mathématiques) - 
92 ; contours apparents 
d'une — : 92 ; — gauche : 
118; — non orientable : 
129 ; ombres d'une — : 92 ; 

— réglée : 88 ; — riemanien- 
ne : 126, 129; —s du se¬ 
cond ordre (= quadriques) : 
154. 

Suslin (Mihail Jakovleviô), 
1894-1919, mathématicien 
russe - 6. 

Sylvester (James Joseph), 
1814-1897, mathématicien 
anglais - 12, 22. 33, 37, 47, 
58, 59, 77. 

Symbolisme (en Mathémati¬ 
ques) - — algébrique : 9 ; — 
littéral : 5. 

Sym E (= groupe symétrique 
de E) - 40. 

Symétrie (en Mathématiques) 

— 16, 83 ; voir aussi Élément 
(en Mathématiques), Expres¬ 
sion (en Mathématiques), 
Groupe (en Mathématiques), 
Matrice (en Mathémati¬ 
ques) ; — axiale (= antidépla¬ 
cement) : 149; — canoni¬ 
que : 22, 23. 

Système décimal - 138. 
Système d'équations — im¬ 
possible (= incompatible) : 
58 ; — indéterminé : 58. 


T 

Tâbit b. Qurra al-Harrànï - 

voir Harrâni. 

Table trigonométrique 91. 

Tait (Peter Guthrie), 1831 -1901, 
mathématicien et physicien 
écossais -128. 

Tamerlan - voir Tîmür Lang. 

Tangente (à une courbe) -148, 
153 ; — et dérivée : 113, 
115. 

Tangente (en Trigonométrie) - 
90 ; — hyperbolique : 118. 

Tannery (Paul), 1843-1904, his¬ 
torien des sciences français 
- 1 . 

Tartaglia (Niccolô Fontana, dit), 
v. 1499-1557, mathémati¬ 
cien italien - 5, 11, 72 ; voir 
aussi Méthode (en Mathéma¬ 
tiques). 

Tartakovskij (Vladimir Abramo- 
viô), 1901- , mathémati¬ 

cien soviétique - 32. 

Taylor (Brook), 1685-1731, ma¬ 
thématicien anglais - 5, 6, 
103, 104 ; voir aussi Formule 
(en Mathématiques), Série 
(en Mathématiques). 

Tchebichev - voir Ùebyëev. 

Tchebychev - voir Cebyëev. 

Tenseur - 66. 

Tensoriel - analyse — le : 66 ; 
calcul — : 58, 66 ; espace 
produit — : 66. 

Terracini (Alessandro), 1889- 
, mathématicien italien - 
78, 124. 

Tétraèdre - 148. 

Thaïes - voir Thalès. 

Thalès (Thalès), fin du VII e s.- 
v. 550 av. J.-C., philosophe 
grec - 3, 4, 75 ; voir aussi 
Axiome, Théorème (en Ma¬ 
thématiques). 

Theaitëtos - voir Théétète. 

Théétète (Theaitëtos), v. 410- 
v. 368 av. J.-C., mathémati¬ 
cien grec disciple de Socrate 

- 4, 24. 

Théodore de Cyrène (Theodô- 
ros), IV e s., philosophe grec 

- 4. 

Theodoros (philosophe grec), 
voir Théodore de Cyrène. 

Theôn - voir Théon d'Alexan¬ 
drie, Théon de Smyrne. 

Théon d'Alexandrie (Theôn), 
IV e s., astronome et mathé¬ 
maticien grec - 4. 

Théon de Smyrne (Theôn), 


II e s., mathématicien et phi¬ 
losophe grec - 24. 

Théorème (en Mathématiques) 

— — d'Abel : 72, 73 ; — de 
Bézout : 139, 143; — de 
Bolzano : 110; — de Bolza- 
no-Weierstrass : 107, 118; 

— de Cantor : 19, 54, 55; 

— de Cayley : 40 ; — de 
Descartes : 72 ; — de Des¬ 
cartes-Euler : 128; — de 
Dirichlet : 27, 155; — de 
Gauss : 139; — de Gauss- 
D'Alembert (= — fondamen¬ 
tal de l'algèbre) : 5, 12, 72, 
73 , 144 ; — de Gôdel : 5, 
14 ; — de Hausdorff : 107 ; 

— de Lagrange : 41 ; — de 
la moyenne (= — des ac¬ 
croissements finis) : 115 ; 

— de Pappus : 87 ; — de 
Pasch : 80 ; — de Picard : 

125 ; — de Poncelet : 150 ; 

— de Pythagore : 3, 8, 27, 
31, 86, 91, 96, 147; dernier 

— de Fermât : 24, 27 ; — 
de Rolle : 72, 73, 115; — 
des accroissements finis (= 

— de la moyenne) : 115 ; — 
de Schwarz : 156 ; — des 
fonctions composées : 114 ; 

— des probabilités compo¬ 
sées : 133 ; — des probabili¬ 
tés totales : 133; — des 
quatre couleurs : 128; — 
des trois perpendiculaires : 
147 ; — de Sturm : 73 ; — 
de Thalès : 11, 83, 148; — 
de Zermelo : 18 ; — du point 
fixe de Picard et Banach : 
123; — fondamental de la 
géométrie projective : 87 ; 

— fondamental de l'algèbre 
(— de Gauss-D'Alembert) : 
5, 12, 72, 73, 144; — fonda¬ 
mental de l'arithmétique : 
25 ; réciproque du — de Py¬ 
thagore : 86. 

Théorie (en Logique et en Ma¬ 
thématiques) - catégoricité 
d'une — : 14 ; — de la simili¬ 
tude : 4 ; — des congruen¬ 
ces : 28 ; — des courbes 
planes : 93, 94 ; — des dé¬ 
terminants : 58 ; — des en¬ 
sembles : 3, 5, 7, 13, 15 ; — 
des équations (= algèbre) : 
11, 66 ; — des fonctions : 

105 ; — des fonctions analy¬ 
tiques : 124 ; — des fonc¬ 
tions d'une variable com¬ 
plexe : 105; — des formes 
algébriques : 58 ; — des for¬ 
mes différentielles quadrati¬ 
ques : 124; — des formes 
quadratiques : 36 ; — des 
graphes : 129 ; — des grou¬ 
pes : 5, 36 ; — des groupes 
de Lie : 36 ; — des groupes 
de substitution : 12, 73; — 
des limites : 106, 108; — 
des matrices : 59 ; — des 
nombres : 4, 5, 10, 11, 24, 
52 ; — des nombres algébri¬ 
ques : 12 ; — des nombres 
chez les Grecs : 7, 8 ; — 
des nombres entiers : 24 ; 

— des proportions : 4, 24 ; 

— du cobordisme : 130 ; — 
sij-npliciale : 130. 

THEORIE DES FONCTIONS 
ANALYTIQUES, œuvre de 
Lagrange, 1797 - 104. 

Thom (René), 1923- , ma¬ 

thématicien français - 130. 

Thue (Axel), 1863-1922, mathé¬ 
maticien norvégien - 6, 25. 

Thureau-Dangin (François), 
1872-1944, assyriologue 
français - 2. 

Tietze (Heinrich Franz Frie¬ 
drich), 1880-1964, mathéma¬ 
ticien autrichien - 129. 

Tîmür Lang (Tamerlan), 1336- 
1405, souverain turc du Tur- 
kestan - 24. 

Topologie - 5, 127 ; — algébri¬ 
que : 36, 127, 128, 129, 
131 ; —discrète : 131 ; — 
générale’: 127, 128, 131; 

— générale de la droite réel¬ 
le : 129; —grossière : 131. 

Torricelli (Evangelista), 1608- 
1647, physicien et mathéma¬ 
ticien italien - 103. 

Tousi (al-), voir Muzaffar. 

Trace (en Mathématiques) — 
d'un ensemble sur un au¬ 
tre : 16. 

TRACTA TUS DE QUADRA TU- 
RA CURVARUM voir Traité 
de la quadrature des courbes. 

TRAITE DE LA QUADRATU¬ 
RE DES COURBES (Tracta- 
tus de quadratura curvarum), 
traité écrit par Newton en 
1676 et publié en 1704-104. 

Trajectoire orthogonale -160. 

Transfini - nombre — ordinal : 
20; —ordinal : 19; premier 
nombre — cardinal (x 0 ) : 19- 

Transformation (en Mathéma¬ 
tiques) - 76 ; — affine : 76, 
83 ; — birationnelle : 77 ; 
groupe de —s : 149; — 
identique : 149; — involuti- 
ve : 149; — linéaire : 64; 

— par polaires réciproques : 

77, 149; produit de 

deux —s : 149; — récipro¬ 
que : 149; —s en Géomé¬ 
trie classique : 148; —s 
ponctuelles : 149. 

Transitivité (en Mathémati- 
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ques) - 16. 

Translation -83; — dans le 
plan : 84, 149 ; — des axes : 
99. 

Transposition- 35 ; — d'une 
matrice : 60. 

Trapèze - 148. 

Triangle - 145; — arithméti¬ 
que : 24 ; — arithmétique 
de Pascal : 33, 103, 104. 

Trièdre - 148; — de référen¬ 
ce : 95. 

Trigonométrie - 24, 89, 150; 
invention de la — : 4. 

Trinôme-du second de¬ 

gré : 144; racines du — : 
144. 

TRIPARTY EN LA SCIENCE 
DES NOMBRES (Le), traité 
de Nicolas Chuquet, 1484 - 
10. 

Triplet — pythagoricien : 27. 

Tronc (en Géométrie)-de 

cône : 148; — de prisme : 
148 ; — de pyramide : 148. 

Tüsï (at-) - voir Nâsir ad-Din at- 
Tüsi. 

U 

Ulug Beg (Mehmet Turgay), 
1393-1449, souverain du Tur- 


INDEX 


kestan, mathématicien, his¬ 
torien et astronome - 24. 

c Umar Hayyâm (Omar Khay- 
yam chez les Occidentaux), 
v. 1038-1123, poète et ma¬ 
thématicien iranien - 9, 24, 
137. 

Unité (en Mathématiques) — 
complexe : 32 ; élément 
— : 38 ; — imaginaire : 32 ; 
—s fractionnaires, décima¬ 
les : 139. 


v 

Valeur (en Mathématiques) - 

— absolue : 28, 140; — 
dominante (= mode) : 133; 

— équiprobable (= mé¬ 
diane) : 133; — moyenne 
d'une fonction intégrable : 
121 . 

Valeur d'adhérence - 107. 
Valiron (Georges), 1884-1959, 
mathématicien français -105. 
Vandermonde (Alexandre 
Théophile). 1735-1796, ma¬ 
thématicien français - 5, 12, 
36. 58. 

Van Der Waerden (Bartel 
Leendert), 1903- , mathé¬ 


maticien néerlandais - 37. 
Variable (en Mathématiques) - 
109; — aléatoire : 133; — 
aléatoire réduite : 133; — 
complexe : 125 ; — k-dimen- 
sionnelle : 134; — indépen¬ 
dante (= argument) ; 20 ; — 
réelle : 109. 

Variance - 133. 

Variation (en Mathématiques) 

— de fonctions : 115. 
Variété (en Algèbre) - 129. 
Vérignon (Pierre), 1654-1722, 

mathématicien français -104. 
Veblen (Oswald), 1880-1960, 
mathématicien américain - 
130. 

Vecteur (en Mathématiques) - 
46, 47 ; — à n dimensions : 
48 ; champs de — : 129 ; 
décomposition d'un — : 49 ; 

— géométrique : 47 ; — li¬ 
néairement dépendant : 49 ; 

— linéairement indépen¬ 
dant : 49; mesure algébri¬ 
que d'un — : 81 ; — nul : 
48; — s équipollents : 50, 
85 ; — unitaire : 85, 95. 

Venn (John), 1834-1923, ma¬ 
thématicien anglais - voir Dia¬ 
gramme. 

Veronese (Giuseppe), 1854- 


1917, mathématicien italien 
-37. 

Vessiot (Ernest), 1865-1952, 
mathématicien français -106. 

Vide - ensemble — : 15. 

Viète (François), 1540-1603. 
mathématicien français - 5, 
10. 11, 89. 102, 103. 

Villa (Mario), mathématicien 
italien contemporain - 124. 

Vincensini (Paul Félix), 1896- 
mathématicien fran¬ 
çais - 78. 

Vinogradov (Ivan Matveeviô), 
1891- , mathématicien 

soviétique - 32. 

Virgule (en Mathématiques) - 
139 

Voigt (Woldemar), 1850-1919, 
physicien allemand - 66. 

Voisinage (en Topologie) -105, 
106, 127, 129, 130. 

Votterra (Vito), 1860-1940, ma¬ 
thématicien et physicien ita¬ 
lien - 47, 106, 122. 

Volume - 86 ; calcul de —s : 
159 ; — des corps ronds : 
148; — des polyèdres 

usuels : 148. 

Vranceanu (C. Gheorghe), 
1900- , mathématicien 

roumain - 124. 


w 

Wagner (Richard), 1813-1883, 
compositeur et dramaturge 
allemand - 51. 

Wallis (John), 1616-1703, ma¬ 
thématicien anglais - 1, 6, 
33, 53. 103. 

Wantzei (Pierre Laurent). 1814- 
1848, mathématicien fran¬ 
çais - 73. 

Waring (Edward). 1734-1798, 
mathématicien anglais - 6, 
24, 32, 33, 94 ; voir aussi 
Problème. 

Warren (John). 1796-1852. ma¬ 
thématicien anglais - 53. 

WAS SIND UND WAS SOL- 
LEN DIE ZAHLEN (Ce que 

sont et ce que doivent être 
les nombres), œuvre de De- 
dekind, 1888-41. 

Weber IHeinrich), 1842-1913, 
mathématicien allemand - 43. 

Wedderburn (Joseph Henry 
MacLagan), 1882-1948, ma¬ 
thématicien écossais - 46, 
58. 

Weddle (Thomas). 1817-1853, 
mathématicien anglais - 94. 

Weierstrass (Karl Theodor Wil¬ 


helm), 1815-1897, mathéma¬ 
ticien allemand - 5. 6, 13, 47, 
53, 72. 105, 114, 125, 128; 
voir aussi Théorème (en Ma¬ 
thématiques). 

Weil (André). 1906- . ma¬ 

thématicien français - 6, 78. 

Weingarten (Julius). 1836- 
1910, mathématicien alle¬ 
mand - 78. 

Wessel (Caspar), 1745-1818, 
mathématicien danois - 6, 

12, 53. 

Weyl (Claus Hugo Hermann), 
1885-1955, mathématicien 
allemand - 14, 36, 66, 105. 

Wheeler (David John), 1927- 
, mathématicien anglais 

-25. 

Whitehead (Alfred North), 
1861-1947, mathématicien 
et philosophe anglais - 6, 

13. 14. 

Whitney (Hassler), 1907- 
mathématicien américain - 6, 
66. 129. 

Whdmann (Johann ou Johan¬ 
nes), v. 1440-1524, mathé¬ 
maticien allemand - 10, 24. 

Wilczynski (Ernest Julius), 
1876-1932, mathématicien 
américain - 6. 78, 124. 


Wroriski-Hoene (Jôsef Maria, 
dit aussi Hoene-Wrohski), 
1778-1853, mathématicien 
polonais (ayant vécu en Fran¬ 
ce à partir de 1801) - 58. 


Y 

Yüsuf al-Mu’Tamin, ?-1085, 
mathématicien arabe, roi de 
Saragosse - 137. 


z 

Zariski (Oscar), 1899- , ma¬ 

thématicien américain - 78. 

Zermelo (Ernst), 1871-1953, 
mathématicien allemand - 6, 
14 ; voir aussi Axiome. Théo¬ 
rème (en Mathématiques). 

Zéro (en Mathématiques) - 25 ; 
aleph — : voir Aleph ; —s 
d’un polynôme : 68. 

Zeuthen (Hieronymus Georg), 
1839-1920, historien des ma¬ 
thématiques et mathémati¬ 
cien danois - 1. 

Zone sphérique - 147. 
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